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内 容 简 介 


本 书 以 Python 3.5 为 编程 环境 ， 从 基本 的 程序 设计 思想 入 手 ， 逐 步 展 开 Python 语言 教学 ， 是 一 本 面 
向 广大 编程 学 习 者 的 程序 设计 类 图 书 。 本 书 以 案例 带动 知识 点 的 讲解 ， 将 Python 知识 点 分 解 到 各 个 不 同 
的 案例 ， 每 个 案例 各 有 侧重 点 ， 同 时 展示 实际 项 目的 设计 思想 和 设计 理念 ， 使 读者 可 以 举一反三 。 

本 书 案例 具有 实用 性 ， 例 如 校园 网 搜索 引擎 、 小 小 翻译 器 、 抓 取 百 度 图 片 这 些 爬 虫 案 例 略 加 修改 可 
以 应 用 到 实际 项 目 中 ， 还 有 通过 微 信 通信 协议 开发 微 信 机 器 人 、 机 器 学 习 的 文本 分 类 、 基 于 卷 积 神经 网 
络 的 手写 体 识 别 等 案例 ， 另 外 是 一 些 大 家 耳熟能详 的 游戏 案例 ， 例 如 连连 看 、 推 箱子 、 中 国 象棋 、 网 络 
五 子 棋 、 两 人 麻将 、 人 物 拼图 和 飞机 大 战 等 游戏 。 通 过 本 书 ， 读 者 将 掌握 Python 编程 技术 和 技巧 ， 学 会 
面向 对 象 的 设计 方法 ， 了 解 程序 设计 的 所 有 相关 内 容 。 本 书 不 仅 为 读者 列 出 了 完整 的 代码 ， 同 时 对 所 有 
的 源 代 码 都 进行 了 非常 详细 的 解释 ， 通 俗 易 慌 、 图 文 并 茂 。 扫 描 每 章 提 供 的 二 维 码 可 观看 知识 点 的 视频 
讲解 。 

本 书 适 用 于 Python 语言 学 习 者 、 程 序 设计 人 员 和 游戏 编程 爱好 者 。 


本 书 封面 贴 有 清华 大 学 出 版 社 防伪 标签 ， 无 标签 者 不 得 销售 。 
版 权 所 有 ， 侵 权 必 究 。 侵 权 举报 电话 : 010-62782989 13701121933 
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Python 语言 从 20 世纪 90 年 代 初 诞生 至 今 ， 逐 渐 被 广泛 应 用 于 处 理 系 统管 理 任务 和 科 
学 计算 ， 是 最 受 欢 迎 的 程序 设计 语言 之 一 。 

学 习 编 程 是 工程 专业 学 生 学 习 的 重要 部 分 ， 除 了 直接 应 用 外 ， 学 习 编程 是 了 解 计算 机 
科学 本 质 的 方法 。 计 算 机 科学 对 现代 社会 产生 了 毋庸 置疑 的 影响 。Python 是 新 兴 的 程序 设 
计 语 言 ， 是 一 种 解释 型 、 面 向 对 象 、 动 态 数据 类 型 的 高 级 程序 设计 语言 。 由 于 Python 语言 
简洁 、 易 读 并 且 可 扩展 ， 在 国外 用 Python 做 科学 计算 的 研究 机 构 日 益 增多 ， 最 近 几 年 其 社 
会 需求 逐渐 增加 , 许多 国内 高 校 纷纷 开设 Python 程序 设计 课程 。 本 书 编者 长 期 从 事 程序 设 
计 语 言 的 教学 与 应 用 开发 ， 了 解 在 学 习 编程 的 时 候 什么 样 的 书 能 够 提高 Python 开发 能 力 ， 
以 最 少 的 时 间 投 入 得 到 最 快 的 实际 应 用 。 

本 书 内 容 : 

第 1 章 是 Python 基础 知识 ， 主 要 讲解 Python 的 基础 语法 和 面向 对 象 编程 基础 、 图 形 
界面 设计 、Python 文件 的 使 用 、Python 的 第 三 方 库 等 知识 ， 读 者 可 以 轻松 掌握 。 

从 第 2 章 开 始 是 实用 项 目 案例 开发 ， 综 合 应 用 前 面 所 学 的 知识 ， 并 且 每 章 都 有 突出 的 
新 知识 点 ， 例 如 侧重 数据 库 应 用 的 案例 “智力 问答 测试 ” 应 用 疏 虫 技术 开发 的 案例 “校园 
网 搜索 引擎 ” 应 用 itchat 开发 的 案例 “ 微 信 机 器 人 ” 机 器 学 习 案例 “基于 朴素 贝 叶 斯 算 
法 的 文本 分 类 ” 深度 学 习 案例 “基于 卷 积 神经 网 络 的 手写 体 识 别 ” 等， 还 有 经 典 的 、 大 家 
耳熟能详 的 游戏 案例 ， 例 如 连连 看 、 推 箱子 、 中 国 象棋 、 两 人 麻将 、 人 物 拼 图 、 网 络 五 子 
棋 、 飞 机 大 战 等 。 

本 书 特点 : 

(1) Python 程序 设计 涉及 的 范围 非常 广泛 ， 本 书 内 容 的 编排 并 不 求全 、 求 深 ， 而 是 考 
虑 零 基 础 读者 的 接受 能 力 ， 语 言 的 语法 介绍 以 够 用 、 实 用 为 原则 ， 选 择 Python 中 必 备 、 实 
用 的 知识 进行 讲解 ， 强 化 对 程序 思维 能 力 的 培养 。 

(2) 案例 选取 贴近 生活 ， 有 助 于 提高 读者 的 学 习 兴 趣 。 

(3) 书 中 每 个 案例 均 提 供 了 详细 的 设计 思路 、 关 键 技术 分 析 以 及 具体 的 解决 方案 。 

需要 说 明 的 是 ， 学 习 编 程 是 一 个 实践 的 过 程 ， 而 不 仅仅 是 看 书 、 看 资料 ， 亲 自动 手 编 
写 、 调 试 程序 才 是 至 关 重 要 的 。 通 过 实际 的 编程 和 积极 的 思考 ， 读 者 可 以 很 快 地 掌握 许多 
宝贵 的 编程 经 验 ， 这 种 编程 经 验 对 开发 者 来 说 尤其 不 可 或 缺 。 

本 书 由 郑 秋生 和 夏 敏 捷 〈 中 原 工 学 院 ) 主持 编写 ， 吴 婷 (中原 工 学 院 ) 编写 第 6 章 ， 
韩 云 飞 (中 原 工学 院 ) 编写 第 8 章 ， 周 延 萍 编写 第 9、10 章 ， 宋 宝 卫 〈 郑 州 轻工业 学 院 ) 
编写 第 11 一 15 章 ， 陈 海 营 〈 中 原 工学 院 ) 编写 第 16、17 章 ， 高 艳 霞 (中 原 工学 院 ) 编写 
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第 18 章 , 李 娟 (中 原 工学 院 ) 编写 第 19 章 , 郑 秋 生 编 写 第 20 章 , 其 余 章 节 由 夏 敏捷 编写 。 
在 本 书 的 编写 过 程 中 ， 为 确保 内 容 的 正确 性 ， 参 阅 了 很 多 资料 ， 并 且 得 到 了 中 原 工学 院 的 
教材 资助 和 资深 Python 程序 员 的 支持 ,在 此 说 向 他 们 表示 衷心 的 感谢 。 本 书 的 学 习 资 源 可 
以 扫描 封底 课件 二 维 码 获取 。 由 于 编者 水 平 有 限 ， 书 中 难免 有 不 足 之 处 ， 敬 请 广大 读者 批 
评 指正 ， 在 此 表示 感谢 。 





编 者 
2018 年 9 月 





Python 基础 知识 


| 
12 


1.4 








Python 语言 简介 瞄 % ee 1 
Python 语法 基础 和 ~ 
2:1 Python 数据 类 型 后 … 
1.2.2 ”序列 数据 结构 圭 。 
1.2.3 ”Python 控制 语句 氏 ee 
1.2.4 Python 函数 与 模块 所 ” 二 
Python 面向 对 象 设计 
1.3.1 定义 和 使 用 类 钳 eeee 
1.3.2 ”构造 函数 ……… ee 
1.3.3” 析 构 函 数 
1.3.4 实例 属性 和 类 属性 … 
1.3.5 私有 成 员 与 公有 成 员 … 
1.3.6 方法 …… 
1.3.7 类 的 继承 氛 ”… ee 
1.3.8 多 态 饼 ” 二 
1.3.9 面向 对 象 应 用 案例 一 一 扑克 牌 发 牌 程序 氛 ” 

Python 图 形 界 面 设 计 i 
1.4.1 创建 Windows 窗口 虚 人 ee 35 
1.4.2 几何 布局 管理 器 35 
1.4.3 ”Tkinter 组 件 … 
1.4.4 Tkinter 字体 …………………… 
1.4.5 Python 事件 处 理 盎 < 

1.4.6 ”图 形 界面 设计 应 用 案例 一 一 开发 猜 数 字 游 戏 



















1.5 Python 文件 的 使 用 震 % ee 





1.5.1 打开 /建立 文件 寺 eeeeeeeeeee 
152 a 
3 
1.5.4 文件 内 移动 震 … 62 








| 过 二 项 目 案例 开发 








从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 



























155 : 诡 件 的 关闭 mene 63 
1.5.6 二进制 文件 的 读 / 写 冉 0 64 
1.6 Python 的 第 三 方 诺 ee 66 
序列 应 用 一 一 猜 单 词 游戏 67 
2.1 “ 猜 单 词 游戏 功能 褒 绍 党。 67 
22 :程序 设计 的 固有 depisen i 67 
2.3” 关键 技术 一 一 tand0mi 模 换 en 68 
2 :程序 设计 的 由 时 dose 71 
数据 库 应 用 -智力 问答 出 起 3 
3.1 智力 问答 测试 功能 介绍 …………………… 73 
3.2 程序 设计 的 思路 …… 本 
人 关键 技术 饼 ” po 
3.3.1 访问 数据 库 的 步骤 …………… 74 
3.3.2 ”创建 数据 库 和 表 ………… pe 
3.3.3 ”数据库 的 插入 、 更 新 和 删除 操作 
3.3.4 数据 库 表 的 查询 操作 
3.3.5 ”数据库 使 用 实例 一 一 学 生 通 讯 录 Ei 
3.4 ”程序 设计 的 步骤 二 ee 
人 tl 半 成 研 题库 二 
3.4.2” 读 取 试题 信息 
引 3” ”界面 和 多 辑 设计 二 81 
调用 百度 API 应 用 小 小 翻译 器 ………… 83 
4.1 小 小 翻译 器 功能 介绍 霹 。 83 
4.2 程序 设计 的 思路 …… 83 
4.3 ”关键 技术 炭 …… -84 
4.3.1 aurllib 库 简介 -…… “84 
1 84 
4.4 程序 设计 的 步骤 所 ” 
4.4.1 设计 界面 ……… 多 
本 4 2 使 用 百度 翻译 开放 平台 APBL re 90 
让 由 应 用 一 -校园 网 委 过 引 莹 …………… 95 
5.1 校园 网 搜索 引擎 功能 分 析 震 ee 95 
5.2 校园 网 搜索 引擎 系 统 设计 enseesessesissssient 移 





第 8 


过 
3 
5.3.4 
人 
5.3.6 本 
5.4 程序 设计 的 步 驳 es 107 
5.4.1 “信息 采集 模块 一 一 网 络 息 虫 的 实现 炭 0…………… 107 
5.4.2 索引 模块 一 一 建立 倒 排 词 表 …… + 
5.4.3 ”网 页 排名 和 搜索 模块 二 


故 虫 应 用 一 一 抓 取 百 度 图 片 … 


6 程序 功能 介绍 所 i 
6.2 程 序 设 计 的 思路 TT 
6.3 关键 技术 th 
6.3.1 图 片 文件 下 载 到 本 地 … 
6.3.2” 息 取 指 定 网 页 中 的 图 片 … 
6.3.3 ”BeautifulSoup 库 概述 ………………………… -人 19 
6.3.4 用 BeautifulSoup 库 操作 解析 HTML 文档 树 … 
6.3.5 ”requests 库 的 使 用 … 
6.4 程序 设计 的 步 又 





































6.4.1 分 析 网 页 源 代码 和 网 页 结构 ……… 133 
6.4.2 ”设计 代码 因 人 eee 136 
itchat 应 用 一 一 微 信 机 器 人 …………………… 139 
7.1 itchat 功能 介绍 所 
元 去 -程序 作 诈 的 中 夏 导 2 
和 
7.3.1 安装 itchat-… … 
ye 140 
Ek I 141 
7.3.4 itchat 回复 消息 … 本 
7353 Hehat 了 由 时 
7.3.6 ”itchat 的 一 些 简单 应 用 -es 147 
7.3.7 ”Python 调用 图 灵机 器 人 API 实现 简单 的 人 机 交互 饼 ”…-150 


7.4 程序 设计 的 步骤 一 
7.5 开发 消息 同步 机 器 人 





微 信 网 页 版 协议 应 用 一 一 微 信 机 器 人 155 
8.1 微 信 网 页 版 机 器 人 功能 介绍 贿 155 





ps 项 目 案例 开发 





ENE 


ETEN 


从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 








8 .2 ， 微 信 网 页 版 机 器 人 设计 思路 -ee 
8.2.1 分析 微 信 网 页 版 API- 村 
8.2.2 API 汇 题 
82.3 ”其 他 说 明 -ee 

8.3 程序 设计 的 步骤 一 
83.1 微 信 网 页 版 的 运行 流程 …… Le 
8.3.2 程序 目录 167 
8.3.3 ” 微 信 网 页 版 运行 代码 的 实现 … - 

Oe 
en 二 症 生 人 
8.4.2 群发 消息 、 定 时 发 送 消息 、 好 友 状 态 检测 . 
8.4.3 ”自动 洲 请 好 友 加 入 群 聊 …… 





图 像 处 理 一 一 生成 二 维 码 和 验证 码 - 









9.1 二 维 码 介绍 党 和 .178 
9.2 二 维 码 生成 和 解析 关键 技术 … .179 









9.2.1 qrcode 库 的 使 用 …… 179 
9.2.2 PIL 库 的 使 用 …… …182 
9.3 二 维 码 生成 和 解析 程序 设计 的 步骤 … …184 
9.3.1 生成 带 有 图 标的 二 维 码 .0 184 
O32 Python 解析 二 维 码 图 片 pe ee 186 
9.4 用 了 Python 生成 验证 码 图 片 虚 0 186 
蔡 智 游戏 一 一 连连 看 游戏 ………………… 
10.1 连连 看 游戏 介绍 所 ” 本 
03 得 丹 设 许 的 入 症 守 enoemenmenoeyereyen 
10.3 ”关键 技术 冉 
10.3.1 图 形 绘制 一 一 Tinker 的 Canvas 组 件 - - 
103 作 Gai 二 的 图 并 对 人 委 ai 
10.4 程序 设计 的 步骤 詹 人 0 
益 智 游戏 推 箱 子 游戏 …… 
11.1 推 箱子 游戏 介绍 震 。 215 
11.2 程序 设计 的 思路 -216 
11.3 ”关键 技术 …… 29219 
过 4 程序 设计 的 步 本 全 218 
娱乐 游戏 一 一 两 人 麻将 游戏 …………… 224 
12.1 麻将 游戏 介绍 雯 224 








12.2.3 ” 碰 / 吃 牌 的 判断 











12.2.4 和 牌 算法 圭 。 
12.2.5 ”实现 计算 机 智能 出 生 ee 2 和 
12.3 ”关键 技术 …… 233 
12.3.1 声音 的 播放 ……… " 
1232 返回 对 应 位 置 的 组 件 和 全 areatereeeree 233 
12.3.3 ”对 保存 麻将 牌 的 列表 排序 234 
12.4 两 人 麻将 游戏 设计 的 步骤 …… -235 
12.4.1 设计 麻将 牌 类 所 Ea 235 
12.4.2 设计 游戏 主 程序 饼 ae ei a 237 
网 络 编程 案例 一 一 基于 TCP 的 在 线 聊天 程序 ……247 
13.1 基于 TCP 的 在 线 聊 天 程序 简介 撩 ee 247 
六 革 逢 找 术 See 
13.2.1 互联 网 TCP/IP 协议 … 
ey 1 Cg | Ee 
13.2.3 ”TCP 协议 和 UDP 协议 …………… 249 
13.2.4 Socket a 
六 5 站 和 乓 和 
13.3 在 线 聊 天 程序 设计 的 步骤 壤 和 ee 5 
13.3.1 ”在线 聊 天 程序 的 服务 器 端 - 
1552 磊 副 天 程序 的 客户 哆 ssaieinbi 259 
网 络 通信 案例 一 一 基于 UDP 的 网 络 五 子 棋 
A 263 
14.1 网 络 五 子 机 游戏 简介 








14.2 ”五子棋 游戏 的 设计 思想 … 


14.3.1 UDP 编程 所 <… 


14.3.2 自 定义 网 络 五 子 棋 游 戏 的 通信 协 -269 
14.4 ”网络 五 子 棋 游戏 程序 设计 的 步骤 依 271 
14.4.1 服务 器 端 程序 设计 的 步骤 ……………… 271 
144.2， 客户 回程 序 设计 的 几 瞻 sss 276 





| 党 要 项 目 案例 开发 





| 


| 第 16 章 | 


| 第 17 章 | 


| 第 18 章 | 


[vu 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


益 智 游戏 一 一 中 国 象 模 二 281 


15.1 中 国 象棋 介绍 震 。 
站 六 类 肆 技 机 
15.3 ”中国 象棋 的 设计 思路 -… - 

154 中国 象 棋 实 现 的 步 骆 雪 Veeee 287 


娱乐 游戏 一 一 人 物 拼图 游戏 ………… 297 


16.1 人 物 拼图 游戏 介绍 饼 ” 
16.2 程序 设计 的 思路 
5 
16.3.1 复制 和 粘贴 图 像 区 域 了 
16.3.2 ”调整 尺寸 和 旋转 … 
16.3.3 ”转换 成 灰 度 图 像 … 















1 
6 省 程序 这 计 鸭 水 时 sn 
16.4.1 Python 处 理 图 片 切割 加 
16.4.2 游戏 的 逻辑 实现 所 本 
基于 Pygame 的 游戏 设计 OR 306 
1 306 
17.1.1 安装 Pygame 库 坝 ee 306 


17.1.2 ”Pygame 的 模块 
17.2 ”Pygame 的 使 用 





17.2.1 Pygame 开发 游戏 的 主要 流程 ……………… 309 
17.2.2 Pygame 的 图 像 /图 形 绘制 

17.2.3 Pygame 的 键盘 和 上 鼠标 事件 的 处 理 314 
12 Pypane 欧 字 体 使 用 ne 319 


17.2.5 ”Pygame 的 声音 播放 - 
17.2.6 ”Pygame 的 精灵 使 用 -… 
17.3 ”基于 Pygame 设计 贪 吃 蛇 游 戏 - 
17.4 











18.2 程序 设计 的 思路 343 






















18,3， 关键 技术 二 einae i 
18.3.1 贝 叶 斯 算法 的 理论 基础 -344 
18.3.2 ”朴素 贝 叶 斯 分 类 …………… .346 
18.3.3 ”使 用 Python 进行 文本 分 类 -ee 348 

a 3 348 
18.4.1 收集 训练 数据 震 348 
18.4.2 ”准备 数 拨 ee 349 
18.4.3 ”分 析 数 据 … .349 
18.4.4 训练 算法 350 
18 半 5 测 谍 算法 并 改进 和 een 353 
18.4.6 ”使 用 算法 进行 文本 分 类 -ee 354 

18.5 ”使 用 朴素 贝 叶 斯 分 类 算法 过 滤 垃 圾 邮件 震 355 
18.5.1 “收集 训练 数据 二 .355 
18.5.2 ”将 文本 文件 解析 为 词 向量 … -356 
18.5.3 ”使 用 朴素 贝 叶 斯 算法 进行 邮件 分 类 … 357 
18.5.4 改进 算法 359 

18.6 ”使 用 Scikit-Learn 库 进 行文 本 分 类. 360 
18.6.1 文本 分 类 常用 的 类 和 函数 二 和 nn 360 
证， 守恒 赤 送 全 363 

深度 学 习 案例 一 一 基于 卷 积 神经 网 络 的 

手写 体 识 呈 0 366 

19.1 手写 体 识别 案例 需求 饼 。… 

19.2 ”深度 学 习 的 概念 及 关键 技术 - 
DD ,PO 
19.2.2 深度 学 习 之 卷 积 神经 网 络 锚 < pan 367 

19.3 Python 深度 学 习 库 一 Keras 饼 a 372 
19.3.1 Keras 的 安装 
19.3.2 ”Keras 的 网 络 层 …- 才 
19.3.3 ”用 Keras 构建 神经 网 络 ……………… 375 


19.4 ”程序 设计 的 思路 炭 “ 

19.5 程序 设计 的 步 又 
Ce 
19.5.2 手写 体 识 别 案例 实现 了 
1953 币 测 自己 搜 写 国 必 i 











| 汪汪 项 目 案例 开发 





参 


Ea 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


| 第 20 章 | 





词 云 实战 疏 取 豆瓣 影评 生成 词 云 383 
20.1 功能 介绍 震 。 383 
20.2 ”程序 设计 的 思路 -ee 384 
20.3 ”关键 技术 僻 ” - 
20.3.1 安装 WordCload -pe 385 
20.3.2 ”使 用 WordCloud ………………………… 385 
20.4 “程序 设计 的 步骤 峙 ee 389 
A 397 





Python 是 一 门 跨 平台 、 开 源 、 免 费 的 解释 型 高 级 动态 编程 语言 ，Python 作为 动态 语言 
更 适合 初学 编程 者 。Python 可 以 让 初学 者 把 精力 集中 在 编程 对 象 和 思维 方法 上 ， 而 不 用 担 
心 语法 、 类 型 等 外 在 因素 。Python 易于 学 习 ， 拥 有 大 量 的 库 ， 可 以 高 效 地 开发 各 种 应 用 
程序 。 


1.1 Python 语言 简介 


Python 由 吉 多 范 罗 。 苏 姆 (Guido van Rossum) 于 1989 年 底 发 明 ， 被 广泛 应 用 于 处 理 
系统 管理 任务 和 科学 计算 ， 是 最 受 欢迎 的 程序 设计 语言 之 一 。2011 年 1 月 ， 它 被 TIOBE 
编程 语言 排行 榜 评 为 2010 年 度 语言 。 自 从 2004 年 以 后 ,Python 的 使 用 率 呈 线性 增长 , TIOBE 
最 近 公布 的 2018 年 9 月 编程 语言 指数 排行 榜 中 ，Python 超越 Ct+， 首 次 排名 处 于 第 三 位 
(前 两 位 是 Java 和 C)。2017 年 7 月， 根据 IEEE Spectrum 发 布 的 研究 报告 显示 ，Python 已 
经 成 为 世界 上 最 受 欢 迎 的 语言 。 

Python 支持 命令 式 编程 、 函 数 式 编程 ， 完 全 支持 面向 对 象 程序 设计 ， 语 法 简洁 清晰 ， 
并 且 拥 有 大 量 的 几乎 支持 所 有 领域 应 用 开发 的 成 熟 扩展 库 。 

Python 为 用 户 提 供 了 非常 完善 的 基础 代码 库 ， 和 覆盖 了 网 络 、 文 件 、GUI、 数 据 库 、 文 
本 等 大 量 内 容 ， 用 Python 开发 ， 许 多 功能 不 必 从 零 编写 ， 直接 使 用 现成 的 即 可 。 除 了 内 置 
的 库 外 ，Python 还 有 大 量 的 第 三 方 库 ， 也 就 是 别人 开发 的 ,大 家 可 以 直接 使 用 的 库 。 当 然 ， 
也 可 以 自己 开发 代码 通过 很 好 地 封装 ， 作 为 第 三 方 库 给 别人 使 用 。Python 就 像 胶水 一 样 ， 
可 以 把 用 多 种 不 同 语言 编写 的 程序 融合 到 一 起 实现 无 颖 拼接 ， 更 好 地 发 挥 不 同 语言 和 工具 
的 优势 , 满足 不 同 应 用 领域 的 需求 。 所 以 ,Python 程序 看 上 去 简单 易 懂 ， 初 学 者 学 Python， 
不 但 入 门 容易 ， 而 且 将 来 深入 下 去 ， 可 以 编写 那些 非常 复杂 的 程序 。 

Python 同时 支持 伪 编 译 ， 将 Python 源 程序 转换 为 字 节 码 来 优化 程序 和 提高 运行 速度 ， 
可 以 在 没有 安装 Python 解释 器 和 相关 依赖 包 的 平台 上 运行 。 
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Python 语言 的 应 用 领域 主要 如 下 。 

(1) Web 开发 : Python 语言 支持 网 站 开发 ， 比 较 流行 的 开发 框架 有 web2py、Django 
等 。 许 多 大 型 网 站 就 是 用 Python 开发 的 , 例如 YouTube、Instagram 等 。 很 多 大 公司 ,例如 
Google、Yahoo 等 ， 甚 至 NASA (美国 航空 航天 局 ) 都 大 量 地 使 用 Python。 

(2) 网 络 编程 : Python 语言 提供 了 socket 模块 ， 对 Socket 接口 进行 了 两 次 封装 ， 支 持 
Socket 接口 的 访问 ;还 提供 了 urllib、httplib、scrapy 等 大 量 模块 ， 用 于 对 网 页 内 容 进行 读 
取 和 处 理 ， 并 可 以 结合 多 线程 编程 以 及 其 他 有 关 模 块 快速 开发 网 页 息 虫 之 类 的 应 用 程序 ; 
可 以 使 用 Python 语言 编写 CGI 程序 ， 也 可 以 把 Python 程序 嵌入 到 网 页 中 运行 。 

(3) 科学 计算 与 数据 可 视 化 : Python 中 用 于 科学 计算 与 数据 可 视 化 的 模块 很 多 ， 例 如 
NumPy、SciPy、Matplotlib、Traits、TVTK、Mayavi、VPython、OpenCV 等 ， 涉 及 的 应 用 
领域 包括 数值 计算 、 符 号 计算 、 二 维 图 表 、 三 维 数据 可 视 化 、 三 维 动画 演示 、 图 像 处 理 以 
及 界面 设计 等 。 

(4) 数据 库 应 用 : Python 数据 库 模块 有 很 多 ， 例 如 可 以 通过 内 置 的 sqlite3 模 据 访问 
SQLite 数据 库 ; 使 用 pywin32 模块 访问 Access 数据 库 ; 使 用 pymysql 模块 可 
访问 MySQL 数据 库 ， 使 用 pywin32 和 pymssql 模块 访问 SQL Server 数据 库 。 

(5) 多 媒体 开发 : PYMedia 模块 可 以 对 WAV、MP3、AVI 等 多 媒体 格 
式 文件 进行 编码 、 解 码 和 播放 ，PyOpenGL 模块 封装 了 OpenGL 应 用 程序 ht 
编程 接口 ， 通 过 该 模块 可 以 在 Python 程序 中 集成 二 维 或 三 维 图 形 ，PIL 视频 讲解 
(Python Imaging Library, Python 图 形 库 ) 为 Python 提供 了 强大 的 图 像 处 理 
功能 ， 并 提供 广泛 的 图 像 文件 格式 支持 。 

(6) 电子 游戏 应 用 : Pygame 就 是 用 来 开发 电子 游戏 软件 的 Python 模块 ， 使 用 Pygame 
模块 可 以 在 Python 程序 中 创建 功能 丰富 的 游戏 和 多 媒体 程序 。 

Python 有 大 量 的 第 三 方 库 ， 可 以 说 需要 什么 应 用 就 能 找到 什么 Python 库 。 


















































































































































1.2 ”Python 语法 基础 


1.2.1 ”Python 数据 类 型 


计算 机 程序 理所当然 地 可 以 处 理 各 种 数值 。 计 算 机 能 处 理 的 远 不 止 数 i 
值 ， 还 可 以 处 理 文本 、 图 形 、 音 频 、 视 频 、 网 页 等 各 种 各 样 的 数据 ， 不 同 。 回 ms 光 
的 数据 需要 定义 不 同 的 数据 类 型 。 视频 讲解 

@ 数值 类 型 

Python 数值 类 型 用 于 存储 数值 ，Python 支持 以 下 数值 类 型 。 

。 整 型 (int): 通常 被 称 为 整 型 或 整数 ， 是 正 或 负 整 数 ， 不 带 小 数 点 。 在 Python3 中 只 

有 一 种 整数 类 型 (int)， 没 有 Python2 中 的 long。 
。 浮 点 型 (float): 浮 点 型 由 整数 部 分 与 小 数 部 分 组 成 ， 浮 点 型 也 可 以 使 用 科学 记 数 法 
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表示 (2.78E2 就 是 2.78X 10:=278) 。 
。 复数 (complex): 复数 由 实数 部 分 和 虚数 部 分 构成 ， 可 以 用 atbj 或 者 complex(a,b) 
表示 ， 复 数 的 虚 部 以 字母 j 或 结尾， 例如 2+3j。 
数据 类 型 是 不 允许 改变 的 ， 这 就 意味 着 如 果 改 变数 值 数据 类 型 的 值 ， 将 重新 分 配 内 存 
空间 。 
四 字符 串 
字符 串 是 Python 中 最 常用 的 数据 类 型 。 用 户 可 以 使 用 引号 来 创建 字符 串 。Python 不 支 
持 字符 类 型 , 单字 符 在 Python 也 是 作为 一 个 字符 串 使 用 。Python 使 用 单 引 号 和 双 引 号 来 表 
示 字 符 串 是 一 样 的 。 
四 布尔 类 型 
Python 支持 布尔 类 型 的 数据 ， 布 尔 类 型 只 有 True 和 False 两 种 值 ， 但 是 布尔 类 型 有 以 
下 几 种 运算 。 
(1) and (与 ) 运算 :只 有 两 个 布尔 值 都 为 True 时 计算 结果 才 为 True。 








True and True # 结 果 是 True 

True and False # 结 果 是 False 

False and True # 结 果 是 False 

False and False # 结 果 是 False 

(2) or (或 ) 运算 : 只 要 有 一 个 布尔 值 为 True， 计 算 结果 就 是 True。 
True or True # 结 果 是 True 

True or False # 结 果 是 True 

False or True # 结 果 是 True 

False or False # 结 果 是 False 

(3) not (〈 非 ) 运算 : 把 True 变 为 False， 或 者 把 False 变 为 True。 
not True # 结 果 是 False 

not False # 结 果 是 True 


布尔 运算 在 计算 机 中 用 来 做 条 件 判 断 ， 根 据 计算 结果 为 True 或 者 False， 计 算 机 可 以 
自动 执行 不 同 的 后 续 代码 。 

在 Python 中 ， 布 尔 类 型 还 可 以 与 其 他 数据 类 型 做 and、or 和 not 运算 ， 这 时 下 面 的 几 
种 情况 会 被 认为 是 False: 为 0 的 数字 ， 包 括 0、0.0;， 空 字符 串 ''、""; 表示 空 值 的 None; 
空 集合 ， 包 括 空 元 组 9、 空 序列 ]、 空 字典 人 。 其 他 的 值 都 为 Tue。 例 如 : 


a='python' 

print (a and True) “ # 结 果 是 True 
Br 

print(b or False)  # 结 果 是 False 
@ 空 值 


空 值 是 Python 中 的 一 个 特殊 值 ， 用 None 表示 。 它 不 支持 任何 运算 ， 也 没有 任何 内 置 
函数 方法 。None 和 任何 其 他 数据 类 型 比较 永远 返回 False。 在 Python 中 未 指定 返回 值 的 函 
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数 会 自动 返回 None。 


1.2.2 ”序列 数据 结构 


数据 结构 是 计算 机 存储 、 组 织 数据 的 方式 。 序 列 是 Python 中 最 基本 的 数据 结构 。 序 列 
中 的 每 个 元 素 都 分 配 一 个 数字 ， 即 它 的 位 置 或 索引 , 第 1 个 索引 是 0， 第 2 个 索引 是 1， 依 
此 类 推 。 序列 都 可 以 进行 的 操作 包括 索引 、 截 取 (切片 )、 加 、 乘 、 成 员 检查 。 此 外 ，Python 
已 经 内 置 确定 序列 的 长 度 以 及 确定 最 大 和 最 小 元 素 的 方法 。Python 内 置 序列 类 型 最 常见 的 
是 列表 、 元 组 和 字符 串 。 另 外 ，Python 提供 了 字典 和 集合 这 样 的 数据 结构 ， 它 们 属于 无 顺 
序 的 数据 集合 体 ， 不 能 通过 位 置 索引 来 访问 数据 元 素 。 加 

上 列表 下 

列表 (List) 是 最 常用 的 Python 数据 类 型 ， 列 表 的 数据 项 不 需要 具有 ji 
相同 的 类 型 。 列 表 类 似 其 他 语言 的 数组 ， 但 功能 比 数组 强大 得 多 。 回 

创建 一 个 列表 , 只 要 把 逗号 分 隔 的 不 同 数据 项 使 用 方 括号 括 起 来 即 可 ， 视频 讲解 
实例 如 下 。 

list1=[" 中 国 '，' 美 国 "，1997，2000] 

Tst2= 23 4 

list3=["a", "b", "c", "d"]; 

列表 索引 从 0 开始。 列表 可 以 进行 截取 (切片 )、 组 合 等 。 

1) 访问 列表 中 的 值 

使 用 下 标 索 引 来 访问 列表 中 的 值 ， 同 样 可 以 使 用 方 括 号 的 形式 截取 字符 ， 实 例如 下 。 

list1=[' 中 国 '，' 美 国 '，1997,，2000]; 

E23 

prinEt*ListLLIOl: » LEstLLOl) 

print tLdstall Sl ist2plasT 

以 上 实例 的 输出 结果 : 

list1[0]: 中 国 

i en Na [| 

2) 更 新 列表 

可 以 对 列表 的 数据 项 进行 修改 或 更 新 ， 实 例如 下 。 

1ist=['" 中 国 '， "chemistry'，1997，2000]; 

print ("Value available at index 2 : ") 

print (list[2]) 

list[2]=2001; 


print ("New value available at index 2 : ") 
print (list[2]) 


以 上 实例 的 输出 结果 : 


Value available at index 2 : 
1997 
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New value available at index 2 : 
2001 


3) 删除 列表 元 素 
方法 一 : 使 用 del 语句 来 删除 列表 中 的 元 素 ， 实 例如 下 。 


1ist1=['" 中 国 '， "美国 '，1997，20001] 

print (list1) 

del list1l[21] 

print ("After deleting value at index 2 : ") 
print (list1) 

以 上 实例 的 输出 结果 : 


[' 中 国 '"，' 美 国 '，1997，2000] 
After deleting value at index 2 : 


[' 中 国 '，' 美 国 '，2000] 
方法 二 : 使 用 remove0 方 法 来 删除 列表 中 的 元 素 ， 实 例如 下 。 


list1=[' 中 国 '，' 美 国 '，1997，2000] 
listl.remove (1997) 
1ist1.remove (' 美 国 ') 

print (list1) 


以 上 实例 的 输出 结果 : 

[' 中 国 '，2000] 

方法 三 : 使 用 pop0 方 法 来 删除 列表 中 指定 位 置 的 元 素 ， 无 参数 时 删除 最 后 一 个 元 素 ， 
实例 如 下 。 

list1=[' 中 国 '，' 美 国 '，1997，2000] 


list1.pop (2) # 删 除 位 置 2 的 元 素 1997 
1ist1.pop() # 删 除 最 后 一 个 元 素 2000 
print (list1) 

以 上 实例 的 输出 结果 : 


[' 中 国 '，' 美 国 '] 
4) 添加 列表 元 素 
可 以 使 用 append0 方 法 在 列表 的 末尾 添加 元 素 ， 实 例如 下 。 


1ist1=[' 中 国 '，' 美 国 '，1997，2000] 
listl1.append (2003) 
print (list1) 


以 上 实例 的 输出 结果 : 
[' 中 国 '，' 美 国 '，1997,，2000，2003] 


5) 定义 多 维 列表 
可 以 将 多 维 列表 视 为 列表 的 嵌 套 ， 即 多 维 列表 的 元 素 值 也 是 一 个 列表 ， 只 是 维度 比 父 


5| 





| 号 本 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


列表 小 一 。 二 维 列表 〈 即 其 他 语言 的 二 维 数组 ) 的 元 素 值 是 一 维 列表 ， 三 维 列表 的 元 素 值 
是 二 维 列表 。 例 如 定义 一 个 二 维 列表 。 

list2=[["CPU"， "内存"]，[" 人 硬盘" "声卡 "]] 

二 维 列表 比 一 维 列表 多 一 个 索引 ， 可 以 如 下 获取 元 素 : 

列表 名 [索引 1] [索引 2] 

例如 定义 3 行 6 列 的 二 维 列表 ， 打 印 出 元 素 值 。 


TOwS=3 





Cols=6 
matrix=[[0 for col in range(cols)] for row in range (Fows)] 
列表 生成 式 生成 二 维 列表 
for i in range (rows): 
for j in range (cols) : 
matrix[i] [j]=i*3+j 
print (matrix[i] [j],end=",") 
pELnE(tE Na 
以 上 实例 的 输出 结果 : 
Ol 3 A 
3 GT 
OOo 
列表 生成 式 (List Comprehensions) 是 Python 内 置 的 一 种 极其 强大 的 生成 列表 的 表达 
式 。 如 果 要 生成 一 个 list [1 ,2 ,3 ,4,5,6,7,8,9]， 可 以 用 range(1,10): 





>>> L=list (range (1,10)) >. A | 
如 果 要 生成 [1 X1,2X2,3X3 ,… , 10X10]， 可 以 使 用 循环 : 
>>> L=[] 


>>> for x in range(1,10): 
L.append (x*x) 

> 

Ta oe 2 a6 A Moa el 

列表 生成 式 ， 可 以 用 以 下 语句 代替 以 上 烦琐 的 循环 来 完成 : 

>>> [x*x for x in range(1,11)] 

Te ee ri | 

列表 生成 式 的 书写 格式 为 把 要 生成 的 元 素 x*x 放 到 前 面 ， 后 面 跟 上 for 循环 。 这 样 就 
可 以 把 列表 创建 出 来 。for 循环 后 面 还 可 以 加 上 站 判 断 ， 例 如 第 选 出 偶数 的 平方 : 

>>> [x*x for x in range(1,11) if x%2==0] 


[4, 16, 36, 64, 100] 


再 如 ， 把 一 个 列表 中 的 所 有 字符 串 变 成 小 写 形式 : 
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>>> I=[7Hel1o"， "7 World'，"IBM"， "RARpple"] 

>5> [9S TowSr() for sin Tl 

['hello', 'world', 'ibm', 'apple'] 

当然 ， 列 表 生 成 式 也 可 以 使 用 两 层 循环 ， 例 如 生成 ABC' 和 'XYZ' 中 字母 的 全 部 组 合 : 
>>> print([mtn for m in "ABC' for n in "7XY27]) 


[le en cer 


for 循环 其 实 可 以 同时 使 用 两 个 甚至 多 个 变量 ,例如 字典 (Dict) 的 items() 可 以 同时 过 














代 key 和 value: 


改 。 元 组 使 用 小 括号 0， 列 表 使 用 方 括号 []。 元 组 中 的 元 素 类 型 也 可 以 不 
相同 。 


>>> d={'X': IIy': 'B'，'z': !'C'} 4# 字 典 
>>2 for Er Vv LEemsty 
print (K，' 键 ='，vVv,， endl=';') 


程序 的 运行 结果 : 

y 键 =B; x 键 =A; z 键 =C; 

因此 ， 列 表 生 成 式 也 可 以 使 用 两 个 变量 来 生成 列表 : 

>>> d={'x': ROY 'B', 'z': 'C'} 

>>> [k+'='+V for k，V in d.items()] 

['y=B', 'x=A', '2z=C'] 

@ 元 组 

Python 的 元 组 〈tuple) 与 列表 类 似 ， 不 同 之 处 在 于 元 组 的 元 素 不 能 修 





1) 创建 元 组 视频 讲解 
元 组 的 创建 很 简单 ， 只 需要 在 括号 中 添加 元 素 ， 并 使 用 逗号 隔 开 即 可 ， 实 例如 下 。 
tupl=(' 中 国 '，' 美 国 '"，1997，2000) 


(a 2 ee 5) 
tup3="an, "br, cn, nd" 


如 果 是 创建 空 元 组 ， 只 需 写 个 空 括号 即 可 。 














tup1=() 
当 元 组 中 只 包含 一 个 元 素 时 ， 需 要 在 第 1 个 元 素 后 面 添加 逗号 。 
tupl=(50,) 


元 组 与 字符 串 类 似 ， 下 标 索引 从 0 开始 ， 可 以 进行 截取 、 组 合 等 。 
2) 访问 元 组 

元 组 可 以 使 用 下 标 索 引 来 访问 元 组 中 的 值 ， 实 例如 下 。 
tupl=(' 中 国 '"，' 美 国 '"，1997，2000) 

Eup2e (a 2 a en 








| 上 本 项 目 案例 开 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 





EnE(EupTIOT ”Eaplioly # 输 出 元 组 的 第 1 个 元 素 

print ("tup2[1:5]: ™, tup2[1:5]) # 切 片 ， 输 出 从 第 2 个 元 素 开 始 到 第 5 个 元 素 
print (tup2[2:]) # 切 片 ， 输 出 从 第 3 个 元 素 开始 的 所 有 元 素 
print (tup2 * 2) # 输 出 元 组 两 次 

以 上 实例 的 输出 结果 : 

tupl[0]: 中 国 


二 aaD2 25] (27 3 A 3) 

(3, 4, 5, 6, 7) 

le ee 

3) 连接 元 组 

元 组 中 的 元 素 值 是 不 允许 修改 的 ， 但 可 以 对 元 组 进行 连接 组 合 ， 实 例如 下 。 
tupl=(12, 34, 56) 

tup2=(78, 90) 


#tupl [0]=100 # 修 改元 组 中 元 素 的 操作 是 非法 的 
tup3=tupl+tup2 # 连 接 元 组 ， 创 建 一 个 新 的 元 组 
print (tup3) 

以 上 实例 的 输出 结果 : 





(12, 34, 56, 78, 90) 


4) 删除 元 组 

元 组 中 的 元 素 值 是 不 允许 删除 的 ， 但 可 以 使 用 del 语句 来 删除 整个 元 组 ， 实 例如 下 。 
tup=(' 中 国 '，' 美 国 '，1997，2000); 

print (tup) 

del tup 

print ("After deleting tup : ") 

print (tup) 

以 上 实例 元 组 被 删除 后 ， 输 出 变量 会 有 异常 信息 ， 输 出 如 下 。 


("中 国 "， "美国 "，1997，2000) 
After deleting tup : 
NameError: name 'tup' is not defined 


5) 元 组 与 列表 的 转换 
因为 元 组 数 不 能 改变 ， 所 以 将 元 组 转换 为 列表 从 而 可 以 改变 数据 。 实 际 上 ， 列 表 、 元 
组 和 字符 串 之 间 可 以 互相 转换 ， 需 要 使 用 3 个 函数 ， 即 sttO0、tuple0 和 list()。 

可 以 使 用 下 面 的 方法 将 元 组 转换 为 列表 : 

列表 对 象 =1ist (元 组 对 象 ) 





例如 : 

Eupe ll Dr dd 5 

list1=1ist (tup) # 元 组 转换 为 列表 

print (1ist1) 世 到 加 [2 三 4 
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可 以 使 用 下 面 的 方法 将 列表 转换 为 元 组 : 
元 组 对 象 =tuple (列表 对 象 ) 
例如 : 


nums— ll 3 5 7 8 320] 
print (tuple (nums) ) # 列 表 转 换 为 元 组 ， 返 回 (1，3，5, 7,8,，13，20) 


将 列表 转换 成 字符 串 如 下 : 


SEE 0 

strl=str (nums) # 列 表 转 换 为 字符 串 ， 返 回 含 中 括号 及 逗号 的 ' [1，3，5，7，8， 
#13，20] ' 字 符 串 

print (str1[2]) # 打 印 出 逗号 ， 因 为 字符 串 中 索引 号 为 2 的 元 素 是 逗号 

num2=[' 中 国 '，' 美 国 '，' 日 本 '，' 加 拿 大 '] 


与 记 守 之 生 中 靳 人 

str2=str2.join (num2) # 用 百 分 号 连接 起 来 的 字符 串 一 一 ' 中国 $ 美 国 $ 日 本 $s 加拿大 ' 
str2="" 

str2=str2.join(num2) ， # 用 空 字 符 连接 起 来 的 字符 串 一 一 ' 中 国美 国 日 本 加 拿 大 ' 

加 字典 


Python 字典 (dict) 是 一 种 可 变 容器 模型 ， 且 可 存储 任意 类 型 对 象 ， 例 
如 字符 串 、 数 字 、 元 组 等 其 他 容器 模型 。 字 典 也 被 称 为 关联 数组 或 哈 希 表 。 

1) 创建 字典 

字典 由 键 和 对 应 值 (key=>value) 成 对 组 成 。 在 字典 的 每 个 键 / 值 对 中 ， 
键 和 值 用 冒号 分 隔 ， 键 / 值 对 之 间 用 逗号 分 隔 ， 整 个 字典 包括 在 花 括号 中 。 
其 基本 语法 如 下 : 


d={keyl: valuel, key2: value2} 


注意 : 键 必须 是 唯一 的 ， 值 则 不 必 。 值 可 以 取 任 何 数据 类 型 ， 但 键 必 须 是 不 可 变 的 ， 
例如 字符 串 、 数 字 或 元 组 。 





视频 讲解 


一 个 简单 的 字典 实例 : 
站 
当然 也 可 以 如 此 创建 字典 : 


dictl={'abc': 456}; 

dict2=1abc's, 23 9826: 3737 

字典 有 如 下 特性 : 

(1) 字典 值 可 以 是 任何 Python 对 象 ， 例 如 字符 串 、 数 字 、 元 组 等 。 

(2) 不 允许 同一 个 键 出 现 两 次 ， 在 创建 时 如 果 同 一 个 键 被 赋值 两 次 ， 后 一 个 值 会 覆盖 
前 面 的 值 。 

dict={'Name': 'xmj', 'Age': 17, 'Name': 'Manni'}; 

print ("dict['Name']: ", dict['Name']); 

















| 六 要 项 目 案例 开发 





从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
以 上 实例 的 输出 结果 : 
dict['Name']: Manni 
(3) 键 不 可 变 ， 所 以 可 以 用 数字 、 字 符 串 或 元 组 充当 ， 用 列表 不 行 ， 实 例如 下 。 
dict={['Name']: 'Zara', 'Age': 7}; 
以 上 实例 输出 错误 结果 : 
Traceback (most recent call last): 
File "<pyshell#0>", line 1, in <module> 
dict={['Name']: 'Zara', 'Age': 7} 
TypeError: unhashable type: 'list' 
2) 访问 字典 里 的 值 
在 访问 字典 里 的 值 时 把 相应 的 键 放 到 方 括 号 中 ， 实 例如 下 。 
dict={"Name': "下海"，"Age": 17， "Class": "计算 机 一 班 中 
print ("dict['Name']: ", dict['Name']) 
print ("dict['Age']: ", dict['Age']) 
以 上 实例 的 输出 结果 : 
dict['Name']: 王 海 
dict[l Ager le LL 
如 果 用 字典 里 没有 的 键 访问 数据 ， 会 输出 错误 信息 : 
dict=t" Nane': “下海 "，"Age": "177 “Class": 计算 机 三 班 呈 
print(sarctl sox le ndGicEISS 
由 于 没有 sex 键 ， 以 上 实例 输出 错误 结果 
Traceback (most recent call last): 


File "<pyshell#10>", line 1, in <module> 
printi*dlet Db sex le "dlcElsexd ly 


























KeyError: ‘sex' 


3) 修改 字典 

向 字典 里 添加 新 内 容 的 方法 是 增加 新 的 键 / 值 对 ， 修 改 或 删除 已 有 键 / 值 对 ， 实 例如 下 。 
dict={'Name' : ' 王 海 '， "age': 17， "Class': "计算 机 一 班 '} 

dict['Age']=18 # 更 新 键 / 值 对 

dict['school']=" 中 原 工学 院 " ## 增 加 新 的 键 / 值 对 

print ("dict['Age']: ", dict['Age']) 

prinEt*alct[l Schoon ls "dct[lsSchoou ls 


以 上 实例 的 输出 结果 : 


dict['Age']: 18 
dict['school']: 中原 工学 院 
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4) 删除 字典 中 的 元 素 
del0 方 法 允许 使 用 键 从 字典 中 删除 元 素 〈 条 目 )。clear() 方 法 清空 字典 中 的 所 有 元 素 。 
显 式 删 除 一 个 字典 用 del 命令 ， 实 例如 下 。 


dict=f'Name': ' 王 海 '，"'Age': 17，'Class": "计算 机 一 班 " 




















del dict['Name'] # 删 除 键 是 'Name' 的 元 素 (条 目 ) 
dict.clear() # 清 空 字典 中 的 所 有 元 素 

del dict # 删 除 字 典 ， 用 del 删除 后 字典 不 再 存在 
5) in 运算 











字典 里 的 in 运算 用 于 判断 某 键 是 否 在 字典 里 ， 对 于 value 值 不 适用 ， 其 功能 与 
has_key (key) 相 似 。 
dict=t Name"s " 王 海 '"，"Age": 17，"Class": "计算 机 一 班 "Y 








print ('Age' in dict) # 等 价 于 print (dict.has_key('Age')) 
以 上 实例 的 输出 结果 : 

True 

6) 获取 字典 中 的 所 有 值 

dict.values() 以 列表 形式 返回 字典 中 的 所 有 值 。 


dict={ "Name': ' 王 海 '，'"Age": 17，'Class": "计算 机 一 班 ")} 

print (dict.values ()) 

以 上 实例 的 输出 结果 : 

[17,，' 王 海 '"， “计算 机 一 班 "] 

7) items() 方 法 

items() 方 法 把 字典 中 的 每 对 key 和 value 组 成 一 个 元 组 , 并 把 这 些 元 组 放 在 列表 中 返回 。 

dict=1"Nane': "下海" "nges: 17 "CUassu yi 计算 机 三 班 二 

for key,value in dict.items(): 

print (key, value) 

以 上 实例 的 输出 结果 : 

Name 王 海 

class 计算 机 一 班 

Age 17 

注意 : 字典 打印 出 来 的 顺序 与 创建 之 初 的 顺序 不 同 ， 这 不 是 错误 。 字典 中 的 各 个 元 素 
并 没有 顺序 之 分 ( 因为 不 需要 通过 位 置 查找 元 素 )， 所 以 在 存储 元 素 时 进行 了 优化 ,使 字典 
的 存储 和 查询 效率 最 高 。 这 也 是 字典 和 列表 的 另 一 个 区 别 : 列表 保持 元 素 的 相对 关系 ， 即 
序列 关系 ; 而 字典 是 完全 无 序 的 ， 也 称 为 非 序 列 。 如 果 想 保持 一 个 集合 中 元 素 的 顺序 ， 需 
要 使 用 列表 ， 而 不 是 字典 。 


@ 集合 
集合 (set) 是 一 个 无 序 不 重复 元 素 的 序列 。 集 合 的 基本 功能 是 进行 成 员 关 系 测试 和 删 
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| 芝 且 项 目 案例 开发 
从 入 门 到 实战 一 一 让 虫 、 游 戏 和 机 器 学 习 
除 重复 元 素 。 
1) 创建 集合 
可 以 使 用 大 括号 ({}) 或 者 set0 函 数 创建 集合 。 注 意 ， 创 建 一 个 空 集合 必须 用 set()， 
而 不 是 用 人 }， 因 为 位 用 来 创建 一 个 空 字典 。 
student={'Tom’', ‘'Jim', 'Mary', 'Tom', 'Jack', 'Rose'} 
print (student) “# 输 出 集合 ， 重 复 的 元 素 被 自动 去 掉 
以 上 实例 的 输出 结果 : 
tudek ee “Ros MMary ee Mrmy ee NTOowmLy, 
2) 成 员 测 试 
例如 : 


if('Rose' in student) : 
print ('Rose 在 集合 中 ') 























Sse 
print ('Rose 不 在 集合 中 ') 
以 上 实例 的 输出 结果 : 
Rose 在 集合 中 
3) 集合 运算 
可 以 使 用 “-”“|”“&” 运 算 符 进 行 集合 的 差 集 、 并 集 、 交 集运 算 ， 例 如 : 
#set 可 以 进行 集合 运算 


a=set ('abcd') 
b=set ('cdef') 


print (a) 

print ("a 和 Pb 的 差 集 : "，a - b) #a 和 的 差 集 
print ("a 和 pb 的 并 集 : "，a | b) #a 和 b 的 并 集 
print ("a 和 b 的 交集 : "，a & b) #a 和 bb 的 交集 


print ("a 和 bb 中 不 同时 存在 的 元 素 : "，a ^ b) #a 和 b 中 不 同时 存在 的 元 素 
以 上 实例 的 输出 结果 : 

a 

a 和 bb 的 差 集 : {'a'，'b'} 

a 和 bb 的 并 集 :; {'b'， va', 'f', 'd', iC, 'e'} 

a 和 上 b 的 交集 : {'c'，'d'} 

a 和 bb 中 不 同时 存在 的 元 素 : {'a'，'e',，'f','b'} 


1.2.3 “Python 控制 语句 


对 于 Python 程序 中 的 执行 语句 , 默认 是 按照 书写 顺序 依次 执行 的 , 通常 说 这 样 的 语句 
是 顺序 结构 的 。 但 是 ， 仅 有 顺序 结构 还 不 够 ， 因 为 有 时 候 需要 根据 特定 的 情况 有 选择 地 执 
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行 某 些 语句 ， 这 时 就 需要 一 种 选择 结构 的 语句 。 另 外 ， 有 时 候 还 可 以 在 给 ” 国 六 x 后 
定 条 件 下 重复 执行 某 些 语句 ， 通 常 称 这 些 语句 是 循环 结构 的 。 有 了 这 3 种 
基本 结构 ， 就 能 构建 任意 复杂 的 程序 了 。 

3 种 基本 程序 结构 中 的 选择 结构 ， 可 以 用 寺 语 句 、f…else 语句 和 还 … 视频 讲解 
elif.…else 语句 实现 。 

让 语句 是 一 种 单 选 结构 ， 它 选择 的 是 做 与 不 做 。 站 语句 的 语法 形式 如 下 : 

if 表达 式 : 

语句 1 


让 语句 的 流程 图 如 图 1-1 所 示 。 














图 1-1 让 语句 的 流程 图 
if…else 语句 是 一 种 双 选 结构 , 用 于 解决 在 两 种 备 选 行动 中 选择 哪 一 个 的 问题 。if…else 
语句 的 语法 形式 如 下 : 
if 表达 式 : 
语句 1 


elsey 
语句 2 


if…else 语句 的 流程 图 如 图 1-2 所 示 。 





图 1-2 ”让 …else 语句 的 流程 图 


[ 贺 1-1 输入 一 个 年 份 ， 判 断 是 否 为 头 年 。 
六 年 的 年 份 必 须 满足 以 下 两 个 条 件 之 一 : 
(1) 能 被 4 整除 ， 但 不 能 被 100 整除 。 

(2) 能 被 400 整除 。 








pe 项 目 案例 开 


从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


分 析 : 设 变量 year 表示 年 份 ， 判 断 year 是 否 满足 以 下 表达 式 。 
条 件 (1) 的 逻辑 表达 式 是 year%4-0&&year%100 !=0。 

条 件 (2) 的 逻辑 表达 式 是 year%400 一 0。 

两 者 取 “ 或 ”” 即 得 到 判断 闻 年 的 逻辑 表达 式 : 


(years4==0 and year®100!=0) or Years400==0 
程序 代码 : 


year=int (input (' 输 入 年 份 :')) # 输 入 x，input () 获取 的 是 字符 串 ， 所 以 需要 转换 成 整 弄 
if years4==0 and yearsl001!=0 or years400==0: 间 注 意 运算 符 的 优先 级 

print (year，" 是 半年 ") 
elses 

print (Year， "不 是 头 年 ") 


在 判断 间 年 后 ， 也 可 以 输入 某 年 某 月 某 日 ， 判 断 这 一 天 是 这 一 年 的 第 几 天 。 以 3 月 5 
日 为 例 ， 应 该 先 把 前 两 个 月 的 天 数 加 起 来 ， 然 后 再 加 上 5 天 ， 即 本 年 的 第 几 天 。 特 殊 情况 
是 闵 年 ， 在 输入 月 份 大 于 3 时 需 考虑 多 加 一 天 。 

















程序 代码 : 

year=int (input ('year:')) # 输 入 年 
month=int (input ('month:')) # 输 入 月 
day=int (input ('day:')) # 输 入 日 


months=(0, 31,59, 90,120,151,181, 212, 243, 273, 304, 334) 
if 0<=month<=12: 
sum=months [month - 1] 
elses 
print (' 月 份 输入 错误 ') 
sumt+=day 
leap=0 
if (year%400==0) or ((Yyears4==0) and (year®100!=0)): 
leap=1 
if (leap==1) and (month>2): 
sum+=1 
print (' 这 一 天 是 这 一 年 的 第 $d 天 '%sum) 
有 时 候 需 要 在 多 组 动作 中 选择 一 组 执行 , 这 时 就 要 用 到 多 选 结构 ， 对 于 Python 语言 来 
说 就 是 直 …elif…else 语句 。 该 语句 的 语法 形式 如 下 : 
if 表达 式 1: 
语句 1 
elif 表达 式 2: 
语句 2 
elif 表达 式 n: 
语句 n 
全 下 SS 
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语句 n+1 
注意 : 最 后 一 个 elif 子 句 之 后 的 else 子 句 没有 进行 条 件 判 断 ， 它 实际 上 处 理 跟 前 面 所 
有 条 件 都 不 匹配 的 情况 ,所 以 else 子 句 必须 放 在 最 后 。 if…elif-…else 语句 的 流程 图 如 图 1-3 
所 示 。 











图 1-3 ”if…elif…else 语句 的 流程 图 


[ 圆 1-2 输入 学 生 的 成 绩 score， 按 分 数 输出 其 等 级 ， 即 score 宇 90 为 优 ，90>score 过 
80 为 良 ，80>score 宇 70 为 中 等 ，70>score 宇 60 为 及 格 ，score<60 为 不 及 格 。 


score=int (input ("请 输入 成 绩 ") ) #int () 转换 字符 串 为 整 型 
if score>=90 : 
print (" 优 ") 
elif score>=80: 
Print (" 良 ") 
elif score>=70: 
prunele hn 
elif score>=60: 
print ("及 格 ") 
SEE 
print ("不 及 格 ") 

说 明 : 在 3 种 选择 语句 中 ， 条 件 表达 式 都 是 必 不 可 少 的 组 成 部 分 。 当 条 件 表达 式 的 值 
为 零 时 ， 表 示 条 件 为 假 ， 当 条 件 表达 式 的 值 为 非 零 时 ， 表 示 条 件 为 真 。 那 么 哪些 表达 式 可 
以 作为 条 件 表 达 式 呢 ? 最 常用 的 是 关系 表达 式 和 逻辑 表达 式 ， 例 如 

if a==x and b==y : 

print ("a=x, b=y") 


除 此 之 外 ， 条 件 表达 式 可 以 是 任何 数值 类 型 的 表达 式 ， 字 符 串 也 可 以 








| 号 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
be 可 
print ("a=x, b=y") 
另外 ，C 语言 用 花 括号 外来 区 分 语句 体 ， 但 Python 的 语句 体 是 用 缩 进 形式 来 表示 的 ， 
如 果 缩 进 不 正确 ， 会 导致 逻辑 错误 。 
@ 循环 结构 
程序 在 一 般 情况 下 是 按 顺 序 执行 的 。 编 程 语言 提供 了 各 种 控制 结构 ， 
允许 更 复杂 的 执行 路 径 。 循 环 语句 允许 用 户 执 行 一 个 语句 或 语句 组 多 次 ， 
Python 提供 了 for 循环 和 while 循环 (在 Python 中 没有 do…while 循环 )。 
1) while 语句 
在 Python 编程 中 ，while 语句 用 于 循环 执行 程序 ， 即 在 某 条 件 下 循环 - 
执行 某 段 程序 ， 以 处 理 需 要 重复 处 理 的 相同 任务 。 其 基本 形式 如 下 : 视频 讲解 
while 判断 条 件 : 
执行 语句 
执行 语句 可 以 是 单个 语句 或 语句 块 。 判 断 条 件 可 以 是 任何 表达 式 ， 任 何 非 零 或 非 空 的 
值 均 为 True。 当 判断 条 件 为 False 时 ， 循 环 结束 。while 语句 的 流程 图 如 图 1-4 所 示 。 

















图 1-4 while 语句 的 流程 图 
同样 需要 注意 冒号 和 缩 进 ， 例 如 : 


count=0 
while count<5: 
print('The count is:', count) 
count=count+1 
print ("Good bye!") 
2) for 语句 
for 语句 可 以 遍历 任何 序列 的 项 目 , 例如 一 个 列表 、 元 组 或 者 一 个 字符 
串 。for 循环 的 语法 格式 如 下 : 田 
for 循环 索引 值 in 序列 视频 讲解 
循环 体 


for 循环 会 把 列表 中 的 元 素 遍历 出 来 ,例如 以 下 代码 会 依次 打印 fruits 中 的 每 一 个 元 素 。 


fruits=['banana', "apple'，'mango'] 
EOFTEraaE dn Froalts # 第 2 个 实例 
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print (' 元 素 :'， fruit) 
print ("Good bye!") 


程序 的 运行 结果 : 


元 素 : banana 
元 素 : apple 
元 素 : mango 
Good bye! 


[ 辆 ]13 计算 1 一 10 的 整数 之 和 ， 可 以 用 一 个 sum 变量 做 累加 。 
程序 代码 : 

sum=0 

one mn I A OT le 


SUm=SUm+X 


print (sum) 


如 果 要 计算 1 一 100 的 整数 之 和 ， 从 1 写 到 100 有 点 困难 。Python 提供 了 range(O 内 置 


函数 ， 可 以 生成 一 个 整数 序列 ， 再 通过 list0 函 数 转换 成 列表 。 


例如 ，range(0, 5) 或 range(5) 生 成 的 序列 是 从 0 开始 小 于 5 的 整数 ， 不 包括 5。 
>>> list (range (5)) 

[ou 2 

range(1, 101) 就 可 以 生成 1 一 100 的 整数 序列 ， 计 算 1 一 100 的 整数 之 和 如 下 。 


sum=0 

for x in range(1,101) : 
sum=sum+x 

print (sum) 


3) continue 和 break 语句 


break 语句 在 while 循环 和 for 循环 中 都 可 以 使 用 , 一 般 放 在 直选 择 结构 中 , 一 旦 break 


语句 被 执行 ， 将 使 整个 循环 提前 结束 。 





continue 语句 的 作用 是 终止 当前 循环 ， 并 忽略 continue 之 后 的 语句 ， 然 后 回 到 循环 的 








顶端 ， 提 前 进入 下 一 次 循环 。 


除非 break 语句 能 让 代码 更 简单 或 更 清晰 ， 否 则 不 要 轻易 使 用 。 
[加 14 continue 和 break 用 法 示例 。 


#continue 和 break 用 法 
i=1 
while i<10: 
i+=] 
E20 # 非 双 数 时 跳 过 输出 
continue 
print (i) # 输 出 双 数 2、4、6、8、10 





i=1 


while 1: # 循 环 条 件 为 1 必定 成 立 





| 滞 有 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


print (i) # 输 出 1 一 10 

i+=1 

TO: # 当 工大 于 10 时 跳出 循环 
break 


在 Python 程序 开发 的 过 程 中 , 将 完成 某 一 特定 功能 并 经 常 使 用 的 代码 编写 成 函数 ， 放 
在 函数 库 〈 模 块 ) 中 供 大 家 选用 ， 在 需要 使 用 时 直接 调用 ， 这 就 是 程序 中 的 函数 。 开 发 人 
员 要 善于 使 用 函数 ， 以 提高 编码 效率 ， 减 少 编写 程序 段 的 工作 量 。 


1.2.4 ” Python 国 数 与 模块 


当 某 些 任务 〈 例 如 求 一 个 数 的 阶乘 ) 需要 在 一 个 程序 中 的 不 同位 置 重复 执行 时 ， 会 造 
成 代码 的 重复 率 高 ， 应 用 程序 代码 烦琐 。 解 决 这 个 问题 的 方法 就 是 使 用 函数 。 无 论 是 在 哪 
门 编程 语言 中 ， 函 数 〈 在 类 中 称 为 方法 ， 意 义 是 相同 的 ) 都 扮演 着 至 关 重 要 的 角色 。 模 块 
是 Python 的 代码 组 织 单元 ， 它 将 函数 、 类 和 数据 封装 起 来 以 便 重 用 ， 模 块 往往 对 应 Python 
程序 文件 ，Python 标准 库 和 第 三 方 提 供 了 大 量 的 模块 。 

@ 男 数 的 定义 

在 Python 中 ， 函 数 定义 的 基本 形式 如 下 : 

def 函数 名 (函数 参数 ) : 


函数 体 
return 表达 式 或 者 值 


在 这 里 说 明 几 点 : 

(1) 在 Python 中 采用 def 关键 字 进 行 函 数 的 定义 ， 不 用 指定 返回 值 的 类 型 。 

(2) 函数 参数 可 以 是 零 个 、 一 个 或 者 多 个 ， 同 样 ， 函 数 参数 也 不 用 指定 参数 类 型 ， 因 
为 在 Python 中 变量 都 是 弱 类 型 的 ，Python 会 自动 根据 值 来 维护 其 类 型 。 

(3) 在 Python 中 ， 函 数 定 义 中 的 缩 进 部 分 是 函数 体 。 

(4) 函数 的 返回 值 是 通过 函数 中 的 retum 语句 获得 的 。retum 语句 是 可 选 的 ， 它 可 以 
在 函数 体内 的 任何 地 方 出 现 ， 表 示 函 数 调用 执行 到 此 结束 ; 如 果 没 有 retum 语句 ， 会 自动 
返回 None( 空 值 )， 如 果 有 retum 语句 ， 但 是 retum 后 面 没有 接 表 达 式 或 者 值 ， 也 是 返回 
None ( 空 值 )。 

下 面 定 义 3 个 函数 : 

def printHello() : # 打 印 'hello' 字 符 串 

print('hello') 














def printNum() : # 输 出 数字 0 一 9 
for i in range(0,10): 
print (i) 
return 
def add(a,b): # 实 现 两 个 数 的 和 
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return a+b 


人 @ 琴 数 的 使 用 

在 定义 了 函数 之 后 就 可 以 使 用 该 函数 了 ， 但 是 在 Python 中 要 注意 一 个 问题 ， 就 是 在 
Python 中 不 允许 前 向 引用 ， 即 在 函数 定义 之 前 不 允许 调 上 E 
下 面 的 例子 就 明白 了 : 

print (add (1,2)) 

def add(a,b): 

return a+b 
这 段 程 序 运行 的 错误 提示 如 下 : 


Traceback (most recent call last): 




















File "C:/Users/zxmj/4-1.py", line 1, in <module> 
print (add (1,2)) 
NameError: name "add' is not defined 


从 报 的 错 可 以 知道 ， 名 字 为 add 的 函数 未 进行 定义 。 所 以 在 任何 时 候 调 用 某 个 函数 ， 
必须 确保 其 定义 在 调用 之 前 。 
加 15 编写 函数 ， 计 算 形 如 a+aa+aaa+aaaa +…+ aaa…aaa 的 表达 式 的 值 ， 其 中 a 为 
小 于 10 的 自然 数 。 例 如 2+22+222+2222+22222〈 此 时 n=5)，a、n 由 用 户 从 键盘 输入 。 
分 析 : 关键 是 计算 出 求 和 中 每 一 项 的 值 。 容易 看 出 每 一 项 都 是 前 一 项 扩大 10 倍 后 加 a。 
程序 代码 : 
def suml(a, n): 
result, t=0, 0 # 同 时 将 result、t 赋值 为 0， 这 种 形式 比较 简洁 
for i in range (n) : 
t=t*10+a 
Tresultt=t 


return result 


# 用 户 输 入 两 个 数字 

a=int (input ("输入 a: ")) 

n=int (input ("输入 n: ")) 

print (sum(a, n)) 

程序 运行 结果 : 

输入 a: 2 

输入 n: 5 

24690 

图 闭 包 

在 Python 中 ， 闭 包 〈closure) 指 函数 的 嵌 套 。 用 户 可 以 在 函数 内 部 定 
义 一 个 典 套 函数 ， 将 嵌 套 函数 视 为 一 个 对 象 ， 所 以 可 以 将 嵌 套 函数 作为 定 
义 它 的 函数 的 返回 结果 。 

[ 贺 1-6 使 用 闭 包 的 例子 。 视频 讲解 






































19 | 





| 中 苹 项 目 案例 开发 








调 上 











分 配 到 一 个 模块 里 能 让 代码 更 好 用 、 更 易 懂 。 简 单 地 说 ， 模 块 就 是 一 个 保 
存 了 Python 代码 的 文件 。 在 模块 里 能 定义 函数 、 类 和 变量 。 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
def func lib(): 
def add (x, y): 


return x+y 


return add # 返 回 函 数 对 象 


fadd=func lib() 
Print(fadd(1，2)) 


在 函数 fanc lib0 中 定义 了 一 个 嵌 套 函数 add(x, y)， 并 作为 函数 fanc lib0 的 返回 值 。 
其 运行 结果 为 3。 

@ 函数 的 递归 调用 

函数 在 执行 的 过 程 中 直接 或 间接 调用 自己 本 身 ， 称 为 递归 调用 。Python 语言 允许 递归 


[ 圆 1-7 求 1~5 的 平方 和 。 
def f(x): 
if x==1: # 递 归 调 用 结束 的 条 件 
return 1 
Slses 
return (f (x-1) +x*x) # 调 用 工 () 函数 本 身 
print (£ (5)) 
@ 模块 
通过 模块 (module) 能 够 有 逻辑 地 组 织 Python 代码 段 ， 把 相关 的 代码 





在 Python 中 ， 模 块 和 C 语言 中 的 头 文件 以 及 Java 中 的 包 很 类 似 ， 例 。 ”视频 讲解 











如 在 Python 中 要 调用 sqrt0 函 数 ， 必 须 用 import 关键 字 引 入 math 这 个 模块 。 





1) 导入 某 个 模块 
在 Python 中 用 关键 字 import 来 导入 某 个 模块 ， 方 式 如 下 : 
import 模块 名 # 导 入 模块 


例如 要 引用 模块 math， 就 可 以 在 文件 最 开始 的 地 方 用 import math 来 导入 。 
在 调用 模块 中 的 函数 时 必须 这 样 调用 : 

模块 名 .函数 名 

例如 : 


import math # 导 入 math 模块 
print ("50 的 平方 根 : "，math.sqrt (50)) 


为 什么 必须 加 上 模块 名 这 样 调用 呢 ? 因为 可 能 存在 这 样 一 种 情况 : 在 多 个 模块 中 含有 














相同 名 称 的 函数 , 此 时 如 果 只 是 通过 函数 名 来 调用 , 解释 器 无 法 知道 到 底 要 调用 哪个 函数 。 
所 以 如 果 像 上 述 这 样 导 入 模块 ， 调 用 函数 必须 加 上 模块 名 。 
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有 时 候 只 需要 用 到 模块 中 的 某 个 函数 , 此 时 只 要 引入 该 函数 即 可 , 通过 from 语句 实现 : 
from 模块 名 import 函数 名 1, 函数 名 2… 
通过 这 种 方式 引入 ， 在 调用 函数 时 只 能 给 出 函数 名 ， 不 能 给 出 模块 名 ， 但 是 当 两 个 模 


块 中 含有 相同 名 称 函 数 的 时 候 ， 后 面 一 次 引入 会 覆盖 前 一 次 引入 。 





也 就 是 说 ， 假 如 模块 A 中 有 函数 fun0， 在 模块 B 中 也 有 函数 fhn0， 如 果 引 入 A 中 的 


fun0 在 先 , B 中 的 fun0 在 后 , 那么 在 调用 fan0) 函 数 的 时 候 会 去 执行 模块 B 中 的 fun0 函 数 。 


如 果 想 一 次 性 导入 math 中 的 所 有 东西 ， 还 可 以 通过 以 下 语句 实现 : 
from math import * 


这 是 一 种 简单 的 导入 模块 中 所 有 项 目的 方式 ， 然 而 不 建议 过 多 地 使 用 这 种 方式 。 
2) 定义 自己 的 模块 

在 Python 中 ， 每 个 Python 文件 都 可 以 作为 一 个 模块 ， 模 块 的 名 字 就 是 文件 的 名 字 。 
比如 有 这 样 一 个 文件 fbopy， 在 fibo.py 中 定义 了 3 个 函数 add0、fib0、fib20: 


#fibo.py 
# 非 波 那 四 (Fibonacci) 数列 模块 
def fib(n): # 定 义 到 n 的 斐 波 那 契 数列 
a, b=0, 1 
while b<n: 
print(b, end=' ') 
a, b=b, a+b 
print () 
def fib2 (n) : # 返 回 到 m 的 斐 波 那 契 数列 
result=[] 
a, b=0, 1 
while b<n: 
result .append (b) 
a, b=b, a+b 
return result 
def add(a,b) : 
return a+b 


那么 在 其 他 文件 (例如 testpy) 中 就 可 以 如 下 使 用 : 


#test .py 

import fibo 

加 上 模块 名 称 来 调用 函数 : 

fibo.fib(1000) 结果 是 23 9506 1132213455 991440233 377 610 987 
fibo.fib2 (100) # 遇 厅 是 [1 1 2 3 5 8 13 21 34 5357 09] 
ER # 结 果 是 5 

当然 ， 也 可 以 通过 from fibo import add, fib, fib2 来 引入 。 

直接 通过 函数 名 来 调用 函数 : 
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fib (500) # 结 果 是 1 1 2 3 5 8 13 21 34 55 89 144 233 377 


如 果 想 列举 fibo 模块 中 定义 的 属性 ， 代 码 如 下 : 
import fibo 
dir (fibo) # 得 到 自 定义 模块 fibo 中 定义 的 变量 和 函数 


输出 结果 : 


I" name ", "fip", "Fib2", "add"] 


1.3 Python 面向 对 象 设计 





面向 对 象 程序 设计 (Object Oriented Programming，OOP) 的 思想 主要 针对 大 型 软件 设 
计 而 提出 ， 使 得 软件 设计 更 加 灵活 ， 能 够 很 好 地 支持 代码 复 用 和 设计 复 用 ， 并 且 使 得 代码 
具有 更 好 的 可 读 性 和 可 扩展 性 。 

现实 生活 中 的 每 一 个 相对 独立 的 事物 都 可 以 看 作 一 个 对 象 ， 例 如 一 个 人 、 一 辆 车 、 一 
台 计 算 机 等 。 对 象 是 具有 某 些 特性 和 功能 的 具体 事物 的 抽象 。 每 个 对 象 都 具有 描述 其 特征 
的 属性 及 附属 于 它 的 行为 。 例 如 ， 一 辆 车 有 颜色 、 车 轮 数 、 座 椅 数 等 属性 ， 也 有 启动 、 行 
驶 、 停 止 等 行为 ; 一 个 人 由 姓名 、 性 别 、 年 龄 、 身 高 、 体 重 等 特征 描述 ， 也 有 走路 、 说 话 、 
学 习 、 开 和 车 等 行为 ， 一 台 计 算 机 由 主机 、 显 示 器 、 键 盘 、 鼠 标 等 部 件 组 成 。 

在 人 们 生产 一 台 计 算 机 的 时 候 ， 并 不 是 先生 产 主机 再 生产 显示 器 再 生产 键盘 和 鼠标 ， 
即 不 是 顺序 执行 的 ， 而 是 分 别 生 产 设 计 主机 、 显 示 器 、 键 盘 、 鼠 标 等 ， 最 后 把 它们 组 装 起 
来 。 这 些 部 件 通过 事先 设计 好 的 接口 连接 ， 以 便 协调 地 工作 。 这 就 是 面向 对 象 程序 设计 的 
基本 思路 。 

每 个 对 象 都 有 一 个 类 型 ， 类 是 创建 对 象 实例 的 模板 ， 是 对 对 象 的 抽象 和 概括 ， 它 包含 

对 所 创建 对 象 的 属性 描述 和 行为 特征 的 定义 。 例 如, 马路 上 的 汽车 是 一 个 一 个 的 汽车 对 象 ， 
它们 归属 于 一 个 汽车 类 ， 那 么 车 身 颜色 就 是 该 类 的 属性 ， 开 动 是 它 的 方法 ， 该 保养 了 或 者 
该 报废 了 就 是 它 的 事件 。 
Python 完全 采用 了 面向 对 象 程序 设计 的 思想 ， 是 真正 面向 对 象 的 高 级 动态 编程 语言 ， 
完全 支持 面向 对 象 的 基本 功能 ， 例 如 封装 、 继 承 、 多 态 以 及 对 基 类 方法 的 覆盖 或 重 写 。 与 
其 他 面向 对 象 程序 设计 语言 不 同 的 是 ，Python 中 对 象 的 概念 很 广泛 ，Python 中 的 一 切 内 容 
都 可 以 称 为 对 象 。 例 如 ， 字 符 串 、 列 表 、 字 典 、 元 组 等 内 置 数据 类 型 都 具有 和 类 完全 相似 
的 语法 和 用 法 


1.3.1 定义 和 使 用 类 


@ 类 的 定义 

在 创建 类 时 用 变量 形式 表示 的 对 象 属性 称 为 数据 成 员 或 属性 (成 员 变 。 ”视频 讲解 
量 )， 用 函数 形式 表示 的 对 象 行为 称 为 成 员 函 数 〈 成 员 方 法 )， 成 员 属 性 和 成 员 方 法 统称 为 
类 的 成 员 。 

类 定义 的 最 简单 的 形式 如 下 : 
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class 类 名 : 
属性 (成 员 变 量 ) 
属性 
成 员 函 数 〈 成 员 方 法 ) 
例如 定义 一 个 Person 人 员 类 : 


class Person: 
num=1 # 成 员 变 量 ( 属 性) 
def SayHello(self) : # 成 员 函 数 
print ("Hello!"); 
这 里 在 Person 类 中 定义 了 一 个 成 员 函 数 SayHello(selfj， 用 于 输出 字符 串 "Hello!"。 同 
样 ，Python 使 用 缩 进 标 识 类 的 定义 代码 。 
@ 对 象 的 创建 
对 象 是 类 的 实例 。 如 果 人 类 是 一 个 类 ， 那 么 某 个 具体 的 人 就 是 一 个 对 象 。 只 有 定义 了 
具体 的 对 象 ， 才 能 通过 “对 象 名 .成 员 ” 的 方式 来 访问 其 中 的 数据 成 员 或 成 员 方 法 。 
Python 创建 对 象 的 语法 如 下 : 
对 象 名 = 类 名 () 
例如 ， 下 面 的 代码 定义 了 一 个 Person 类 的 对 象 p: 


p=Person () 
p.SayHello() # 访 问 成 员 函 数 SayHello () 


运行 结果 如 下 : 


Hello! 


1.3.2 ”构造 函数 


类 可 以 定义 一 个 特殊 的 称 为 。_init _0 的 方法 (构造 函数 ， 以 两 个 下 夯 线 “_ _” 开 头 
结束 )。 在 一 个 类 定义 了 __init _0 方 法 以 后 ， 类 实例 化 时 就 会 自动 为 新 生成 的 类 实例 调 
__init _0 方 法 ,构造 函数 一 般 用 于 完成 对 象 数 据 成 员 设 置 初 值 或 进行 其 他 必要 的 初始 化 工 
作 。 如 果 用 户 未 涉及 构造 函数 ，Python 将 提供 一 个 默认 的 构造 函数 。 

例如 定义 一 个 复数 类 Complex， 构 造 函数 完成 对 象 变量 的 初始 化 工作 。 


class Complex: 























沁 














def _ init _(self, realpart, imagpart): 
self.r=realpart 
self.i=imagpart 
x=Complex (3.0,-4.5) 


Print (zr Xi) 


运行 结果 如 下 : 
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B05 


1.3.3” 析 构 函 数 


Python 中 类 的 析 构 函数 是 _del _0， 用 来 释放 对 象 占用 的 资源 ， 在 Python 收回 对 象 
空间 之 前 自动 执行 。 如 果 用 户 未 涉及 析 构 函数 ，Python 将 提供 一 个 默认 的 析 构 函数 进行 必 
要 的 清理 工作 。 

例如 : 


class Complex: 











def init _(self, realpart, imagpart): 
self.r=realpart 
self.i=imagpart 

def _del _(self): 


print ("Complex 不 存在 了 ") 
X=Complex(3.0,-4.5) 
ED Te Rl) 
print (x) 


del x # 删 除 对 象 变量 x 
运行 结果 如 下 : 
= 


<_ main _.Complex object at 0x01F87C90> 
Complex 不 存在 了 


说 明 : 在 删除 对 象 变量 x 之 前 , x 是 存在 的 , 在 内 存 中 的 标识 为 0x01F87C90, 执行 “del 
x” 语 句 后 , 对 象 变 量 x 不 存在 了 ， 系统 自动 调用 析 构 函数 , 所 以 出 现 “Complex 不 存在 了 ” 
的 情况 。 


1.3.4 ”实例 属性 和 类 属性 


属性 (成 员 变量 ) 有 两 种 ， 一 种 是 实例 属性 ， 另 一 种 是 类 属性 〈 类 变量 )。 实 例 属性 
是 在 构造 函数 。_init _0 (以 两 个 下 画 线 “_ ”开头 和 结束 ) 中 定义 的 ， 定 义 时 以 self 作 
为 前 级 类 属性 是 在 类 中 方法 之 外 定义 的 属性 。 在 主 程序 中 (在 类 的 外 部 )， 实例 属性 属于 
实例 (对象)。 只 能 通过 对 象 名 访问 ， 类 属性 属于 类 ， 可 以 通过 类 名 访问 ， 也 可 以 通过 对 象 
名 访问 ， 为 类 的 所 有 实例 共享 。 

[ 男 ]1-8 定义 含有 实例 属性 (姓名 name、 年 龄 age) 和 类 属性 (人 数 num) 的 Person 
(人 员 ) 类 。 


class Person: 


num=1 # 类 属性 
def _ init _(self, str,n): # 构 造 函 数 
self.name=str # 实 例 属性 


self.age=n 
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def SayHello (self): # 成 员 函 数 
print ("Hello!") 
def PrintName (self): # 成 员 函 数 
print (" 姓 名 : "，self .name， "年 龄 : "，self.age) 
def PrintNum(self) : # 成 员 函 数 


print (Person.num) 


## 由 于 是 类 属性 ， 所 以 不 写 self .num 





# 主 程序 

P1=Person (" 夏 敏捷 ", 42) 
P2=Person (" 王 琳 ",36) 
P1.PrintName () 
P2.PrintName () 

Person .num=2 
P1.PrintNum() 
P2.PrintNum() 


运行 结果 如 下 : 


姓名 :” 夏 敏捷 年 龄 : 42 
姓名 : 王 琳 年 龄 : 36 
2 
区 


num 变量 是 一 个 类 变量 ， 它 的 值 将 在 这 个 类 的 所 有 实例 之 间 共享 。 用 户 可 以 在 类 内 部 
或 类 外 部 使 用 Person. num 访问 。 

在 类 的 成 员 函 数 〈 方 法 ) 中 可 以 调用 类 的 其 他 成 员 函 数 〈 方 法 )， 可 以 访问 类 属性 、 
对 象 实例 属性 。 

在 Python 中 比较 特殊 的 是 , 可 以 动态 地 为 类 和 对 象 增加 成 员 , 这 一 点 是 和 很 多 面向 对 
象 程序 设计 语言 不 同 的 ， 也 是 Python 动态 类 型 特点 的 一 种 重要 体现 。 


1.3.5 ”私有 成 员 与 公有 成 员 


了 Python 并 没有 对 私有 成 员 提供 严格 的 访问 保护 机 制 。 在 定义 类 的 属性 时 ， 如 果 属 性 名 
以 两 个 下 画 线 “_ ”开头 ， 表 示 是 私有 属性 ， 否 则 是 公有 属性 。 私 有 属性 在 类 的 外 部 不 能 
直接 访问 , 需要 通过 调用 对 象 的 公有 成 员 方 法 来 访问 , 或 者 通过 Python 支持 的 特殊 方式 来 
访问 。Python 提供 了 访问 私有 属性 的 特殊 方式 ， 可 用 于 程序 的 测试 和 调试 ， 对 于 成 员 方 法 
也 具有 同样 的 性 质 。 这 种 方式 如 下 : 

对 象 名 . _ 类 名 + 私有 成 员 
例如 访问 Car 类 私有 成 员 __weight: 
carl. Car weight 


私有 属性 是 为 了 数据 封装 和 保密 而 设 的 属性 ， 一 般 只 能 在 类 的 成 员 方法 〈 类 的 内 部 ) 
中 使 用 访问 , 虽然 Python 支持 一 种 特殊 的 方式 从 外 部 直接 访问 类 的 私有 成 员 , 但 是 并 不 推 


# 修 改 类 属性 
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荐 大 家 这 样 做 。 公 有 属性 是 可 以 公开 使 用 的 ， 既 可 以 在 类 的 内 部 进行 访问 ， 也 可 以 在 外 部 
程序 中 使 用 。 
贺 19 为 Car 类 定义 私有 成 员 。 


class Car: 
price=100000 # 定 义 类 属性 
def _ init _(self; CE Ww): 
self.color=c # 定 义 公 有 属性 color 
self. _ weight=w # 定 义 私有 属性 ”weight 
# 主 程序 
carl=Car ("Red",10.5) 
car2=Car ("Blue",11.8) 


print (carl.color) 


print(carl. __ Car weight) 

print(carl. __weight) #AttributeError 
运行 结果 如 下 : 

Red 

Oe 

AttributeError: "Car' object has no attribute '_ weight' 


全 3.6” 万 法 


在 类 中 定义 的 方法 可 以 粗略 地 分 为 3 大 类 ， 即 公有 方法 、 私 有 方法 、 静 态 方法 。 其 中 ， 
公有 方法 、 私 有 方法 都 属于 对 象 ， 私 有 方法 的 名 字 以 两 个 下 画 线 “__” 开 始 ， 每 个 对 象 都 
有 自己 的 公有 方法 和 私有 方法 ， 在 这 两 类 方法 中 可 以 访问 属于 类 和 对 象 的 成 员 ， 公 有 方法 
通过 对 象 名 直接 调用 ， 私 有 方法 不 能 通过 对 象 名 直接 调用 ， 只 能 在 属于 对 象 的 方法 中 通过 
self 调用 或 在 外 部 通过 Python 支持 的 特殊 方式 来 调用 。 如 果 通 过 类 名 来 调用 属于 对 象 的 公 
有 方法 ， 需 要 显 式 地 为 该 方法 的 self 参数 传递 一 个 对 象 名 ， 用 来 明确 指定 访问 哪个 对 象 的 
数据 成 员 。 静 态 方法 可 以 通过 类 名 和 对 象 名 调用 ， 但 不 能 直接 访问 属于 对 象 的 成 员 ， 只 能 
访问 属于 类 的 成 员 。 

贺 1-10 公有 方法 、 私 有 方法 、 静 态 方法 的 定义 和 调用 。 

class Fruit: 

price=0 
def _ init _(self): 


self. _color='Red' # 定 义 和 设 置 私有 属性 color 
self. city='Kunming' ## 定 义 和 设 置 私有 属性 city 

def outputColor (self) : # 定 义 私有 方法 outputcolor () 
print (self. _color) # 访 问 私 有 属性 color 

def _ outputCcity (self): # 定 义 私 有 方法 outputcity () 

print (self. city) # 访 问 私 有 属性 city 

def output (self): # 定 义 公 有 方法 output () 

self._ outputcolor() 砷 调用 私有 方法 outputcolor () 
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self. outputCcity() # 调 用 私有 方法 outputcity() 
@ staticmethod 
def getPrice() : # 定 义 静 态 方法 getPrice () 


return Fruit.price 
@ staticmethod 
def setPrice(p) : # 定 义 静 态 方法 setPrice () 
Fruit.price=p 

# 主 程序 
apple=Fruit () 
apple.output () 
print (Fruit.getPrice ()) 
Fruit.setPrice(9) 
print (Fruit.getPrice()) 


运行 结果 如 下 : 


Red 
Kunming 
0 

| 


继承 是 为 代码 复 用 和 设计 复 用 而 设计 的 ， 是 面向 对 象 程序 设计 的 重要 特性 之 一 。 在 设 
计 一 个 新 类 时 ， 如 果 可 以 继承 一 个 已 有 的 设计 良好 的 类 ， 然 后 进行 二 次 开发 ， 无 疑 会 大 幅 
度 减少 开发 的 工作 量 。 


1.3.7 ”类 的 继承 


在 继承 关系 中 ， 已 有 的 、 设 计 好 的 类 称 为 父 类 或 基 类 ， 新 设计 的 类 称 
为 子 类 或 派生 类 。 派 生 类 可 以 继承 父 类 的 公有 成 员 ， 但 是 不 能 继承 其 私有 
成 员 。 
类 继承 的 语法 格式 如 下 : 视频 讲解 
class 派生 类 名 ( 基 类 名 ) : # 基 类 名 写 在 括号 里 
派生 类 成 员 


在 Python 中 继承 有 以 下 特点 : 

(1) 在 继承 中 基 类 的 构造 函数 〈( __init _0 方 法 ) 不 会 被 自动 调用 ， 它 需要 在 其 派生 
类 的 构造 中 专门 调用 。 

(2) 如 果 需 要 在 派生 类 中 调用 基 类 的 方法 ， 通 过 “ 基 类 名 .方法 名 0” 的 方式 来 实现 ， 
需要 加 上 基 类 的 类 名 前 级 ， 且 需要 带 上 self 参数 变量 (在 类 中 调用 普通 函数 时 并 不 需要 带 
上 self 参数 )， 也 可 以 使 用 内 置 函数 super() 实 现 这 一 目的 。 

(3) Python 总 是 先 查 找 对 应 类 型 的 方法 ， 如 果 不 能 在 派生 类 中 找到 对 应 的 方法 ， 它 才 
开始 到 基 类 中 逐个 查找 〈 先 在 本 类 中 查找 调用 的 方法 ， 找 不 到 才 去 基 类 中 找 )。 

[加 1-1 设计 Person 类 , 并 根据 Person 派生 Student 类 , 分 别 创建 Person 类 与 Student 
类 的 对 象 。 
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| 党 要 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


# 定 义 基 类 : Person 类 
import types 
class Person (object) :# 基 类 必须 继承 于 opject， 否 则 在 派生 类 中 将 无 法 使 用 super () 函数 
def _ init _(self, name='', age=20, sex="'man'): 
self.setName (name) 
self.setAge (age) 
self.setSex (sex) 
def setName (self, name): 


if type (name) !=str: # 内 置 函数 type () 返回 被 测 对 象 的 数据 类 型 
print (' 姓 名 必须 是 字符 串 .' ) 
return 


self. name=name 
def setAge(self, age): 
if type (age) !=int: 
print ( "年龄 必须 是 整 型 . ') 
return 
self. _age=age 
def setSex(self, sex): 
if sex!=' 男 ' and sex!=' 女 ': 
print (' 性 别 输入 错误 ') 
return 
self._ _sex=sex 
def show(self) : 
print (' 姓 名 : '，self. name，' 年 龄 ，'，self. _age ，' 性 别 : '，self. _sex) 
# 定 义 子 类 (student 类 )， 在 其 中 增加 一 个 入 学 年 份 私 有 属性 数据 成 员 ) 
class Student (Person): 
def _ init _(self, name='', age=20, sex='man', schoolyear=2016): 
# 调 用 基 类 构造 方法 初始 化 基 类 的 私有 数据 成 员 
Super (Student, self)._ init _(name, age, sex) 
#Person. init (self，name，age，sex)# 也 可 以 这 样 初始 化 基 类 的 私有 数据 成 员 
self.setschoolyear (schoolyear) # 初 始 化 派生 类 的 数据 成 员 
def setSchoolyear (self，schoolyear) : 
self._ _schoolyear=schoolyear 
def show(self) : 


Person.show(self) # 调 用 基 类 的 show () 方 法 
#super (Student，self) .show() ## 也 可 以 这 样 调用 基 类 的 show () 方 法 
print (' 入 学 年 份 : '，self.__schoolyear) 

# 主 程序 

if _ name =="'_ main _': 


zhangsan=Person(' 张 三 '"，19，' 男 ') 
zhangsan.show () 

1isi=student (' 李 四 '，18，' 男 '，2015) 
1isi.show() 


lisi.setAge (20) # 调 用 继承 的 方法 修改 年 龄 


1isi.show() 
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运行 结果 如 下 : 
姓名 :” 张 三 年 龄 : 19 性 别 : 男 
姓名 :” 李 四 年 龄 : 18 性 别 : 男 
入 学 年 份 : 2015 
姓名 :” 李 四 年 龄 : 20 性 别 : 男 
入 学 年 份 : 2015 


方法 重 写 必须 出 现在 继承 中 。 它 是 指 在 派生 类 继承 了 基 类 的 方法 之 后 ， 如 果 基 类 方法 
的 功能 不 能 满足 需求 ， 需 要 对 基 类 中 的 某 些 方法 进行 修改 。 用 户 可 以 在 派生 类 中 重 写 基 类 
的 方法 ， 这 就 是 重 写 。 

贺 1-12 重 写 父 类 〈 基 类 ) 的 方法 。 

class Rnimal: # 定 义 父 类 


def run(self) : 
print (Animal is running...)  # 调 用 父 类 方法 


class Cat (Animal) : # 定 义 子 类 
def run(self) : 
print (Cat is running...) # 调 用 子 类 方法 
class Dog (Animal): # 定 义 子 类 
def run(self) : 
print(Dog is running...) # 调 用 子 类 方法 
c=Dog () # 子 类 实例 
c.run() # 子 类 调用 重 写 方法 


程序 运行 结果 : 

Dog is running... 

当 子 类 Dog 和 父 类 Animal 存在 相同 的 run0 方 法 时 ， 子 类 的 ran0 覆 盖 了 父 类 的 run0)， 
在 代码 运行 时 总 是 会 调用 子 类 的 ran0， 这 样 就 获得 了 继承 的 另 一 个 优点 一 一 多 态 。 


1.3.8 多 态 







要 理解 什么 是 多 态 , 首先 要 对 数据 类 型 再 做 一 点 说 明 :在 定义 一 个 class ” 回 i 
的 时 候 ， 实 际 上 就 定义 了 一 种 数据 类 型 。 通 常 ， 定 义 的 数据 类 型 和 Python ”视频 讲解 
自 带 的 数据 类 型 (例如 string、list、dict) 没什么 区 别 。 


a=113t() #a 是 1ist 类 型 
b=Animal () #b 是 Animal 类 型 
c=Dog () #c 是 Dog 类 型 


一 个 变量 是 否 为 某 个 类 型 可 以 用 isinstance() 判 断 : 


>>> isinstance(a, list) 


True 
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| 屿 羡 项 目 案例 开发 





Dog 


以 被 


从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


>>> isinstance(b, Animal) 
True 
>>> isinstance(c, Dog) 


True 
a、b、c 确实 对 应 list、Animal、Dog 这 3 种 类 型 。 


>>> isinstance(c, Animal) 
True 


因为 Dog 是 从 Animal 继承 的 ， 当 创建 了 一 个 Dog 的 实例 c 时 ， 认 为 c 的 数据 类 型 是 
没 错 ， 但 c 同时 也 是 Animal，Dosg 本 来 就 是 Animal 的 一 种 。 

所 以 ， 在 继承 关系 中 ， 如 果 一 个 实例 的 数据 类 型 是 某 个 子 类 ， 那 么 它 的 数据 类 型 也 可 
看 作 是 父 类 。 但 是 ， 反 过 来 就 不 可 以 : 

>>> b=Animal () 

>>> isinstance(b, Dog) 

False 

Dog 可 以 看 成 Animal， 但 Animal 不 可 以 看 成 Dog。 

要 理解 多 态 的 好 处 ， 还 需要 再 编写 一 个 函数 ， 这 个 函数 接受 一 个 Animal 类 型 的 变量 : 


def run twice (animal) : 





animal.run() 
animal.run() 


当 传 入 Animal 的 实例 时 ，run_twice0 就 打印 出 : 


>>> run twice (Animal ()) 
Animal is running... 
Animal is running... 


当 传 入 Dog 的 实例 时 ，run_twice0 就 打印 出 : 


>>> run twice (Dog () ) 
Dog is running... 
Dog is running... 


当 传 入 Cat 的 实例 时 ，run_twice(0) 就 打印 出 : 


>>> run twice(Cat()) 
Cat is running... 
Cat is running... 


现在 ， 如 果 再 定义 一 个 Tortoise 类 型 ， 也 从 Animal 派生 : 


class Tortoise (Animal): 
def run(self) : 
print('Tortoise is running slowly...') 














用 run_ twice0 时 传 入 Tortoise 的 实例 : 





>>> run twice (Tortoise()) 
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Tortoise is running slowly... 


Tortoise is running slowly... 


大 家 会 发 现 新 增 了 一 个 Animal 的 子 类 , 不 必 对 run_twice0) 做 任何 修改 。 实际 上 , 任何 
依赖 Animal 作为 参数 的 函数 或 者 方法 都 可 以 不 加 修改 地 正常 运行 ， 原 因 就 在 于 多 态 。 

多 态 的 好 处 就 是 ， 当 需要 传 入 Dog、Cat、Tortoise 等 时 ， 只 需要 接收 Animal 类 型 就 可 
以 了 ， 因 为 Dog、Cat、Tortoise 等 都 是 Animal 类 型 ， 然 后 按照 Animal 类 型 进行 操作 。 由 
于 Animal 类 型 有 run() 方 法 ， 因 此 传 入 的 任意 类 型 ， 只 要 是 Animal 类 或 者 子 类 ， 就 会 自动 
调用 实际 类 型 的 run() 方 法 ， 这 就 是 多 态 的 意思 。 

对 于 一 个 变量 ， 用 户 只 需要 知道 它 是 Animal 类 型 ， 无 须 确切 地 知道 它 的 子 类 型 ， 就 
可 以 放心 地 调用 run() 方 法 , 而 具体 调用 的 run() 方 法 是 作用 在 Animal、Dog、Cat 还 是 Tortoise 
对 象 上 ， 由 运行 时 该 对 象 的 确切 类 型 决定 ， 这 就 是 多 态 真正 的 威力 : 调用 方 只 管 调 用 ， 不 
管 细 节 ， 而 当 新 增 一 种 Animal 的 子 类 时 ， 只 要 确保 run() 方 法 编写 正确 ， 不 用 管 原来 的 代 
码 是 如 何 调用 的 。 这 就 是 著名 的 “ 开 闭 ”原则 ， 包 括 以 下 两 点 。 

(1) 对 扩展 开放 : 允许 新 增 Animal 子 类 。 

(2) 对 修改 封闭 : 不 需要 修改 依赖 Animal 类 型 的 run_twice() 等 函数 。 


1.3.9 面向 对 象 应 用 案例 一 一 扑克 牌 发 牌 程序 


【案例 】 采 用 扑克 牌 类 设计 扑克 牌 发 牌 程序 。 

4 名 牌 手打 牌 ， 计 算 机 随机 将 52 张 牌 〈 不 含 大 /小 鬼 ) 发 给 4 名 牌 手 ， 并 在 屏幕 上 显 
示 每 位 牌 手 的 牌 。 程 序 的 运行 效果 如 图 1-5 所 示 。 
[8 "Python 350 She 
He Edshell Debug = Optons = indow= Help- 


Python 3.5.0 01f4567，Sep 13,2015, 02:27:37) [MSC v.1900 64 bit (ALD64)] on win32 
“copyrigl 条 )” for mcre information. 




















































s” or “license( 











in: slcotol 











图 1-5 扑克 有 牌 发 牌 程序 的 运行 效果 


发 牌 程序 设计 出 3 个 类 一 一 Card 类 、Hand 类 和 Poke 类 。 

@ Card 类 

Card 类 代表 一 张 牌 , 其 中 FaceNum 字段 指 的 是 牌 面 数字 1 一 13, Suit 字段 指 的 是 花色 ， 
值 “ 梅 ”为 梅花 、“ 方 ”为 方 钼 、“ 红 ”为 红心 、“ 黑 ”为 黑 桃 。 

(1) Card 构造 函数 根据 参数 初始 化 封装 的 成 员 变量 ， 实 现 牌 面 大 小 和 花色 的 初始 化 ， 
以 及 是 否 显示 牌 面 ， 默 认 True 为 显示 牌 的 正面 。 

(2) __str _0 方 法 用 来 输出 牌 面 大 小 和 花色 。 

(3) pic_order() 方 法 获取 牌 的 顺序 号 ， 牌 面 按 梅 花 1 一 13 一 方块 14~26 一 红 桃 27 一 
39 一 黑 桃 40 一 52 的 顺序 编号 (未 洗 牌 之 前 )。 也 就 是 说 ， 梅 花 2 的 顺序 号 为 2， 方 块 A 的 
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| 党 妥 项 目 案例 开发 

从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

顺序 号 为 14， 方块 K 的 顺序 号 为 26。 这 个 方法 是 为 图 形 化 显示 牌 面 预 留 的 方法 。 
(4) flip0 是 翻 牌 方法 ， 改 变 牌 面 是 否 显示 的 属性 值 。 
#Cards Module 
class Card(): 








mm A playing card. "nn 
RANKS=["A", "2", "3", Am, "Sm, "6", "7", 

m8", “on, "10", wj", "OQ", wK"] # 牌 面 数字 1 一 13 
SUITS=[" 梅 "，" 方 "，" 红 "，" 黑 "] #" 梅 "为 梅花 ，" 方 "为 方 钼 ，" 红 "为 红心 ，" 黑 "为 黑 桃 





def _ init _(self, rank, suit, face up=True): 
self.rank=rank # 指 的 是 牌 面 数字 1 一 13 
self.suit=suit # 指 的 是 花色 
self.is_face up=face_up # 是 否 显示 牌 的 正面 ，True 为 正面 False 为 背面 


def str (self): # 重 写 print () 方 法 ， 打 印 一 张 牌 的 信息 
if self.is face up: 
rep=self.suit+self.rank 
SLses 
rep="XX" 
return rep 


def pic order(self): # 牌 的 顺序 号 
if self.rank=="A": 
FaceNum=1 


elif self.rank=="J": 
FaceNum=11 

elif self.rank=="Q": 
FaceNum=12 

elif self.rank=="K": 
FaceNum=13 

Isa 
FaceNum=int (self.rank) 

if self.suit==" 梅 ": 
Suit=1 

elif self.suit=—" 方 ": 
Suit=2 

elif self.suit==" 红 ": 
Suit=3 

else: 
Suit=4 

return (Suit-1)*13+FaceNum 


def flip(self) : # 翻 牌 方法 
self.is face up=not self.is face up 
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@ Hand 类 
Hand 类 代表 一 手 牌 (一 个 玩家 手 里 拿 的 牌 ), 可 以 认为 是 一 位 牌 手 手 里 的 牌 , 其 中 cards 
列表 变量 存储 牌 手 手 里 的 牌 。 玩 家 可 以 增加 牌 、 清 空手 里 的 牌 、 把 一 张 牌 给 其 他 牌 手 。 


class Hand() : 





"ww A hand of playing cards. "ww 
def init _(self): 
self.cards=[] #cards 列表 变量 存储 牌 手 的 牌 
def _ str _ (self) : # 重 写 print () 方 法 ， 打 印 出 牌 手 的 所 有 牌 
if self.cards: 
rep="" 
for card in self.cards: 
rep+=str (card)+"\t" 
[2 
rep=" 无 牌 " 
return rep 
def clear(self): # 清 空手 里 的 牌 
self.cards=[] 
def add(self, card): # 增 加 有 牌 
self.cards.append (card) 
def give(self，card，other hand) : # 把 一 张 牌 给 其 他 牌 手 
self.cards.remove (card) 
other hand.add (card) 


© Poke 类 
Poke 类 代表 一 副 牌 , 可 以 看 作 是 有 52 张 牌 的 牌 手 , 所 以 继承 Hand 类 。 由 于 其 中 cards 
列表 变量 要 存储 52 张 牌 ， 而且 要 发 牌 、 洗 牌 ， 所 以 增加 如 下 方法 : 
(1) populate(selb 生 成 存储 了 52 张 牌 的 一 手 牌 ， 当 然 这 些 牌 是 按 梅 花 1 一 13 一 方块 
14 一 26 一 红 桃 27 一 39 一 黑 桃 40 一 52 的 顺序 〈 未 洗 牌 之 前 ) 存储 在 cards 列表 变量 中 。 
(2) shufhle(self) 洗 牌 ， 使 用 Python 的 random 模块 的 shuffle() 方 法 打 乱 牌 的 存储 顺序 
即 可 。 
(3) deal(self hands，per hand=13) 是 完成 发 牌 动作 ， 发 给 4 个 玩家 ， 每 人 默认 13 张 
牌 。 当 然 ， 如 果 给 per_ hand 传 10， 则 每 人 发 10 张 牌 ， 只 不 过 牌 没 发 完 而 已 。 
#Poke 类 
class Poke (Hand): 
""" A deck of playing cards. """ 
def populate (self) : # 生 成 一 副 牌 
for suit in Card-SUITS : 
for rank in Card.RANKS: 
self.add (Card (rank, suit)) 


def shuffle (self) : # 洗 牌 
import random 
random.shuffle (self .cards) # 打 乱 牌 的 顺序 


33 | 





| 汐 要 项 目 案例 开发 





从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
def deall(self, hands, per hand=13): # 发 牌 ， 发 给 玩家 ， 每 人 默认 13 张 牌 


for rounds in range (per hand) : 
for hand in hands: 

if self.cards: 
top card=self.cards[0] 
self.cards.remove (top card) 
hand.add (top card) 
#self.give (top card，hand) # 上 两 句 可 以 用 此 语句 替换 

全 ESS 


print ("不 能 继续 发 牌 了 ， 牌 已 经 发 完 !") 


@ 主 程序 

主 程序 比较 简单 ， 因 为 有 4 个 玩家 ， 所 以 生成 players 列表 存储 初始 化 的 4 位 牌 手 。 生 
成 一 副 牌 对 象 实例 pokel， 调 用 populate() 方 法 生成 有 52 张 牌 的 一 副 牌 ， 调 用 shuffle() 方 法 
洗 牌 打 乱 顺序 ， 调 用 deal(players,13) 方 法 发 给 玩家 每 人 13 张 牌 ， 最 后 显示 4 位 牌 手 所 有 























的 牌 。 
# 主 程序 
if _ name ==" main _": 


1.4 


print ("This is a module with classes for playing cards.") 
#4 个 玩家 

players=[Hand(),Hand(),Hand(),Hand()] 

pokel=Poke () 


pokel .populate () # 生 成 一 副 牌 
pokel.shuffle() # 洗 牌 

pokel.deal (players, 13) # 发 给 玩家 每 人 13 张 牌 
# 显 示 4 位 牌 手 的 牌 

n=1 


for hand in players: 
print (" 牌 手 ",n,end=":") 
print (hand) 
n=n+1 
input ("\nPress the enter key to exit.") 


Python 图 形 界面 设计 





Python 提供 了 多 个 图 形 开发 界面 的 库 ， 几 个 常用 的 Python GUI 库 如 下 。 

(1) Tkinter: Tkinter 模块 (Tk 接口 ) 是 Python 的 标准 Tk GUI 工具 包 的 接口 。Tkinter 
可 以 在 大 多 数 Unix 平台 下 使 用 ， 同 样 可 以 应 用 在 Windows 和 Macintosh 系统 里 。Tk8.0 的 
后 续 版 本 可 以 实现 本 地 窗口 风格 ， 并 良好 地 运行 在 绝 大 多 数 平台 中 。 

(2) wxPython: wxPython 是 一 款 开源 软件 ， 是 Python 语言 的 一 套 优秀 的 GUI 图 形 库 ， 
允许 Python 程序 员 很 方便 地 创建 完整 的 、 功 能 键 全 的 GUI 用 户 界 面 。 
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(3) Jython: Jython 程序 可 以 和 Java 无 颖 集成 。 除 了 一 些 标准 模块 以 外 ，Jython 使 用 
Java 的 模块 。Jython 几乎 拥有 标准 的 Python 中 不 依赖 于 C 语言 的 全 部 模块 。 例 如 ，Jython 








的 用 户 界 














i 使 用 Swing、AWT 或 者 SWT。Jython 可 以 被 动态 或 静态 地 编译 成 Java sh 


Tkinter 是 Python 的 标准 GUI 库 。 由 于 Tkinter 是 内 置 到 Python 的 安装 包 中 ， 


装 好 Python， 之 后 就 能 import Tkinter 库 ， 而 且 IDLE 也 是 用 Tkinter 编写 而 成 ， ai 

















面 ，Tkinter 还 是 能 应 付 自 如 的 ， 使 用 Tkinter 可 以 快速 地 创建 GUI 用 和 本 



































书 主要 使 用 Tkinter 设计 图 形 界 面 。 

1.4.1 创建 Windows 窗口 
[ 贺 1-13 使 用 Tkinter 创建 一 个 Windows 窗口 的 GUI 程序。 视频 讲解 
import tkinter # 导 入 Tkinter 模块 
win=tkinter.Tk() # 创 建 Windows 窗口 对 象 
win.title(' 我 的 第 一 个 GUI 程序 ') # 设 置 窗口 标题 
win.mainloop () ## 进 入 消息 循环 ， 也 就 是 显示 窗口 


以 上 ff 


方便 地 创建 Windows 窗口 。 

在 创建 Windows 窗口 对 象 之 后 ， 可 以 使 用 geometry() 方 
法 设置 窗口 的 大 小 ， 格 式 如 下 : 

窗口 对 象 .geometry ("size") 


尺码 的 执行 结果 如 图 1-6 所 示 ， 可 见 Tkinter 可 以 很 sem EI 于 





size 用 于 指定 窗口 大 小 ， 格 式 如 下 : 图 1-6 Tkinter 创建 一 个 窗口 


宽度 之 


Wl 


from 


高 度 ”〈 注 : x 是 小 写字 母 ， 不 是 乘 号 ) 
14 显示 一 个 Windows 窗口 ， 初 始 大 小 为 800 X600。 


tkinter import * 


win=Tk (); 
win.geometry ("800x600") 
win.mainloop(); 


另外 ， 
最 大 尺寸 


还 可 以 使 用 minsize0 方 法 设置 窗口 的 最 小 尺寸 , 使 用 maxsize( 方 法 设置 窗口 的 
方法 如 下 : 


窗口 对 象 . minsize ("最 小 宽度 x 最 小 高 度 ") 
窗口 对 象 . maxsize ("最 大 宽度 x 最 大 高 度 ") 


例如 : 


win. minsize ("400x600") 
win. maxsize ("1440x800") 


1.4.2 


Tkinter 几何 布局 管理 器 (Geometry Manager) 用 于 组 织 和 管理 父 组 件 〈 往 往 是 窗口 ) 


几何 布局 管理 器 
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| 这 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


中 子 组 件 的 布局 方式 。Tkinter 提 供 了 3 种 不 同 风 格 的 几何 布局 管理 类 , 即 pack、grid 和 place。 


@ pack 几何 布局 管理 器 
pack 几何 布局 管理 器 采 上 
其 放 在 快速 生成 的 界面 中 。 

















块 的 方式 组 织 组 件 , pack 布局 根据 子 组 件 创 建生 成 的 顺序 将 


调用 子 组 件 的 方法 pack0， 则 该 子 组 件 在 其 父 组 件 中 采用 pack 布局 : 





pack (option=value, ...) 





pack() 方 法 提供 了 如 表 1-1 所 示 的 若干 参数 选项 。 








表 1-1 pack() 方 法 提供 的 参数 选项 

选 项 描述 取 值 范 
side 停靠 在 父 组 件 的 哪 一 边 上 "top' (默认 值 )、'bottom'、'left、'right 

四 停靠 位 置 ， 对 应 于 东 、 南 、 西 、 北 以 及 4 | '、's'、'e'、'W'、'hWw'、'sw'、'se'、'ne'、'center' 
人 | 个 朋 (默认 值 ) 
fill 填充 空间 x'、'y'、'"both'、'none' 
expand 扩展 空间 0 或 1 
ipadx 、 站 二 人 单位 为 c (厘米 )、m (毫米 )、i (英寸 )、p ( 打 
dt 组 件 内 部 在 x/y 方向 上 填充 的 空间 大 小 印 机 的 点 ) 
padx、pady | 组 件 外 部 在 xyy 方向 上 填充 的 空间 大 小 i 人 








贺 1-15 pack 几何 布局 管理 器 的 GUI 程序 ， 运 行 效果 如 图 1-7 所 示 。 


import tkinter 
Foot=tkinter.TK() 
label=tkinter.Label (root, text='hello, python') 
label .pack () # 将 Label 组 件 添加 到 窗口 中 显示 
buttonl=tkinter.Button (root, text="'BUTTON]1') 

# 创 建文 字 是 “BUTTON1” 的 Button 组 件 
buttonl.pack (side=tkinter .LEFT) 

# 将 buttonl 组 件 添加 到 窗口 中 显示 ， 左 停靠 
button2=tkinter.Button (root, text="'BUTTON2') 

# 创 建文 字 是 “BUTTON2” 的 Button 组 件 
button2.pack (side=tkinter.RIGHT) 

# 将 button2 组 件 添加 到 窗口 中 显示 ， 右 停靠 


root .mainloop () 





@ grid 几何 布局 管理 器 





(tk ed 





grid 几何 布局 管理 器 采用 表格 结构 组 织 组 件 。 子 组 件 的 
位 置 由 行 / 列 确定 的 单元 格 决 定 , 子 组 件 可 以 跨越 多 行 / 列 。 在 
每 一 列 中 ， 列 宽 由 这 一 列 中 最 宽 的 单元 格 确定 。grid 几何 布 
局 管理 器 适合 表现 表格 形式 的 布局 ， 可 以 实现 复杂 的 界面 ， 























BUTTON1 





BUTTON2 








因而 被 广泛 采用 。 


调用 子 组 件 的 grid0 方 法 , 则 该 子 组 件 在 其 父 组 件 中 采用 。 图 1-7 pack 几何 布局 管理 器 





grid 几何 布局 : 
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grid(option=value,...) 
grid() 方 法 提供 了 如 表 1-2 所 示 的 若干 参数 选项 。 
表 1-2 grid() 方 法 提供 的 参数 选项 

















选 项 描述 取 值 范围 

和 组 件 紧 贴 所 在 单元 格 的 某 一 边 角 ， 对 应 | 鄙 、'S、'e、'W、mw'、'swW'、'se'、me'、'center 

Sb 于 东 、 南 、 西 、 北 以 及 4 个 角 (默认 值 ) 

IOW 单元 格 行 号 整数 

column 单元 格 列 号 整数 

IOWSpan 行 跨度 整数 

columnspan | 列 跨度 整数 

ipadx、 ipady | 组 件 内 部 在 xyy 方向 上 填充 的 空间 大 小 es m (毫米 )、i( 美 寸 )、p ( 打 
二 二 二 

padx、pady | 组 件 外 部 在 x/y 方向 上 填充 的 空间 大 小 i mm (毫米 )、i( 美 寸 )、p ( 打 








grid 几何 布局 管理 器 有 两 个 最 为 重要 的 参数 ， 一 个 是 row， 男 一 个 是 column， 用 来 指 
定 将 子 组 件 放置 到 什么 位 置 ， 如 果 不 指定 row， 会 将 子 组 件 放 置 到 第 1 个 可 用 的 行 上 ， 如 
果 不 指定 column， 则 使 用 第 0 列 〈 首 列 )。 

[ 圆 1-16 grid 几何 布局 管理 器 的 GUI 程序 ， 运 行 效果 如 图 1-8 所 示 。 


from tkinter import * 

root=TKk () 

#200x200 代表 了 初始 化 时 主 窗口 的 大 小 ，280 和 280 代表 了 初始 化 时 窗口 所 在 的 位 置 
root .geometry('200x200+280+280"') 

root.title(' 计 算 器 示例 ') 

#grid (网 格 ) 布局 

L1=Button (root, text='1', width=5, bg='yellow') 
L2=Button (root, text='2', width=5) 

L3=Button (root, text='3', width=5) 

L4=Button (root, text='4', width=5) 

L5=Button (root, text='5', width=5, bg='green') 
L6=Button (root, text='6', width=5) 

L7=Button (root, text="'7', width=5) 

L8=Button (root, text="'8', width=5) 

L9=Button (root, text="'9', width=5, bg="'yellow') 
L0=Button (root, text="'0') 

Lp=Button (root, text="'.') 

L1.grid (row=0, column=0) # 按 钮 放置 在 0 行 0 列 
L2.grid (row=0, column=1) # 按 钮 放置 在 0 行 1 列 
L3.grid (row=0, column=2) # 按 钮 放置 在 0 行 2 列 
L4.grid (row=1, column=0) # 按 钮 放置 在 1 行 0 列 
L5.grid(row=1, column=1) # 按 钮 放置 在 1 行 1 列 
L6.grid(row=1, column=2) # 按 钮 放置 在 1 行 2 列 
L7.grid(row=2, column=0) 坦 按钮 放置 在 2 行 0 列 
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| 语 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
L8.grid(row=2, column=1) # 按 钮 放置 在 2 行 1 列 
L9.grid(row=2, column=2) # 按 钮 放置 在 2 行 2 列 
L0.grid(row=3, column=0, columnspan=2,sticky=E+W) # 跨 两 列 ， 左 右 贴 紧 
Lp.grid (row=3, column=2,sticky=E+W) # 左 右 贴 紧 
root .mainloop () 
@ place 几何 布局 管理 器 
place 几何 布局 管理 器 允许 指定 组 件 的 大 小 与 位 置 。 place 几 
何 布 局 管理 器 的 优点 是 可 以 精确 地 控制 组 件 的 位 置 ， 不 足 之 处 
是 改变 窗口 大 小 时 子 组 件 不 能 随 之 灵活 地 改变 大 小 。 
调用 子 组 件 的 方法 place0， 则 该 子 组 件 在 其 父 组 件 中 采用 
place 布局 : 


place (option=value,*…) 


place0 方 法 提供 了 如 表 1-3 所 示 的 若干 参数 选项 , 用 户 可 以 ”图 1-8 ”grid 几何 布局 管理 器 
直接 给 参数 选项 赋值 加 以 修改 。 
表 1-3 ”place() 方 法 提供 的 参数 选项 























选项 取 值 范围 
xy 从 0 开始 的 整数 
relx, rely | 将 组 件 放 到 指定 位 置 的 相对 坐标 0~10 
height, width | 高 度 和 宽度 ， 单 位 为 像素 


anchor 对 齐 方式 ， 对 应 于 东 、 南 、 西 、 北 以 及 4 | n'、's'、'e'、'W'、'nw'、'sw'、'se'、'he'、'center' 
个 角 (默认 值 ) 
注意 : Python 的 坐标 系 是 左上 角 为 原点 位 置 (0.0)， 向 右 是 X 坐标 正方 向 ， 向 下 是 y 坐 
标 正方 向 ， 这 和 数学 中 的 几何 坐标 系 不 同 ， 大 家 一 定 要 注意 这 一 点 。 


加 117 place 几何 布局 管理 器 的 GUI 示例 程序 ， 运 行 效果 如 图 1-9 所 示 。 


from tkinter import * 

root=TKk () 

Foot .title ("登录 ") 
root['width']=200;root['height']=80 





Label (root, text=' 用 户 名 ' , width=6) .place (x=1, y=1) # 绝 对 坐标 (1, 1) 
Entry (root, width=20) .place (x=45, y=1) # 绝 对 坐标 (45, 20) 
Label (root,text=' 密 码 ' ,width=6) .place (x=1, y=20) # 绝 对 坐标 (1, 20) 
Entry (root,width=20, show='*') .place (x=45, y=20) # 绝 对 坐标 (45, 20) 
Button (root, text=' 登录 ',width=8) .place (x=40, y=40) # 绝 对 坐标 (40, 40) 
Button (root, text=' 取 消 ',width=8) .place (x=110, y=40) # 绝 对 坐标 (110, 40) 


root .mainloop () 

















图 1-9 place 几何 布局 管理 器 





第 1 章 Python 基础 知识 01 


1.4.3 Tkinter 组 件 


Tkinter 提供 了 很 多 组 件 ， 例 如 按钮 、 标 签 和 文本 框 等 ， 在 一 个 GUI 应 用 程序 中 使 
这 些 组 件 通常 被 称 为 控件 或 者 部 件 。Tkinter 组 件 如 表 1-4 所 示 。 


表 1-4 Tkinter 组 件 












































熔 :在 描 述 
Button 按钮 控件 ， 在 程序 中 显示 按钮 
Canvas 画布 控件 ， 显 示 图 形 元 素 ， 例 如 线条 或 文本 
Checkbutton 多 选 框 控件 ， 用 于 在 程序 中 提供 多 项 选择 框 
Entry 输入 控件 ， 用 于 显示 简单 的 文本 内 容 
Frame 框架 控件 ， 在 屏幕 上 显示 一 个 矩形 区 域 ， 多 用 来 作为 容器 
Label 标签 控件 ， 可 以 显示 全 四 
Listbox | 
Menubutton 
Menu FT 
Message 与 Label 比较 类 似 
Radiobutton 一 个 单 选 的 按钮 状态 
Scale :一 个 数值 刻度 ， 为 输出 限定 范围 的 数字 区 间 
Scrollbar 
Text 
Toplevel 
Spinbox 
PanedWindow 
LabelFrame 
tMessageBox 





通过 组 件 类 的 构造 函数 可 以 创建 其 对 象 实例 。 例 如 : 
from tkinter import * 


root=TKk () 
button1=Button (root，text=" 确 定 ") # 按 钮 组 件 的 构造 函数 


组 件 的 标准 属性 也 就 是 所 有 组 件 ( 控 件 ) 的 共同 属性 , 例如 大 小 、 字 体 和 颜色 等 。 Tkinter 
组 件 常 用 的 标准 属性 如 表 1-5 所 示 。 
表 1-5 Tkinter 组 件 常用 的 标准 属性 


属 性 描 述 


dimension | 控件 大 小 




















color | 控件 颜色 

font | 控件 字体 

anchor | 锚 点 (内 容 停靠 位 置 )， 对 应 于 东 、 南 、 西 、 北 以 及 4 个 角 

relief | 控件 样式 

. 位 图 ， 内 置 位 图 包括 error、gray75、gray50、gray25、gray12、info、questhead、 
Snag hourglass、question 和 warning， 自 定义 位 图 为 .xbm 格式 的 文件 
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| 克 要 项 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 











续 表 
属 性 描述 
Cursor | 光标 
text | 显示 文本 内 容 
state 设置 组 件 状 态 为 正常 (normal)、 激 活 (active) 或 禁用 (disabled) 





用 户 可 以 通过 下 列 方式 之 一 设置 组 件 的 属性 。 


button1=Button (root，text=" 确 定 ") “并 按钮 组 件 的 构造 函数 
buttonl. config (text=" 确 定 ") # 组 件 对 象 的 config () 方法 的 命名 参数 
buttonl ["text"]=" 确 定 " # 组 件 对象 的 属性 的 赋值 


@ 标签 组 件 Label 

Label 组 件 用 于 在 窗口 中 显示 文本 或 位 图 。anchor 属性 指定 文本 〈Text) 或 图 像 
(Bitmap/Image) 在 Label 中 的 显示 位 置 ( 如 图 1-10 所 示 ， 其 他 组 件 同 此 )， 对 应 于 东 、 南 、 
西 、 北 以 及 4 个 角 ， 可 用 值 如 下 。 

。e: 垂直 居中 ， 水 平 居 右 。 

。 w: 年 直 居 中 ， 水 平 居 左 。 

。n: 垂直 居 上 ， 水 平 居 中 。 

。 s: 垂直 居 下 ， 水 平 居 中 。 

。 ne: 垂直 居 上 ， 水 平 居 右 。 

。 se: 垂直 居 下 ， 水 平 居 右 。 

。 sw: 垂直 居 下 ， 水 平 居 左 。 

。nw: 垂直 居 上 ， 水 平 居 左 。 
center (默认 值 ): 垂直 居中 ， 水 平 居中 。 
[ 贺 1-18 Label 组 件 示例 ， 运 行 效果 如 图 1-11 所 示 。 





from tkinter import * 


win=Tk (); # 创 建 窗口 对 象 

win.title ("我 的 窗口 ") # 设 置 窗口 标题 

labl=Label (win, text=' 你 好 '，anchor='nw') # 创 建文 字 是 “你 好 ”的 Label 组 件 
labl .pack () # 显 示 Label 组 件 

# 显 示 内 置 的 位 图 

lab2=Label (win, bitmap="'question') ## 创 建 显示 疑问 图 标 Label 组 件 
lab2.pack () # 显 示 Label 组 件 

# 显 示 自 选 的 图 片 


bm=PhotoImage (file=r'J:\2018 书稿 \aa.png') 

lab3=Label (win, image=bm) 

lab3 .bm=bm 

lab3.pack () # 显 示 Label 组 件 
win.mainloop () 


@ 按钮 组 件 Button 
Button 组 件 (控件) 是 一 个 标准 的 Tkinter 部 件 ， 用 于 实现 各 种 按钮 。 按 钮 可 以 包含 文 
本 或 图 像 ， 可 以 通过 command 属性 将 调用 函数 或 方法 关联 到 按钮 上 。 当 Tkinter 的 按钮 被 
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按 下 时 会 自动 调用 该 函数 或 方法 。 














人 @， 











图 1-10 anchor 地 理 方位 图 1-11 Label 组 件 示例 


@ 单行 文本 框 组 件 Entry 和 多 行文 本 框 组 件 Text 

Entry 组 件 主要 用 于 输入 单行 内 容 和 显示 文本 , 可 以 方便 地 向 程序 传递 用 户 参 数 。 这 里 
通过 一 个 转换 摄氏 度 和 华氏 度 的 小 程序 来 演示 该 组 件 的 使 用 。 

1) 创建 和 显示 Entry 对 象 

创建 Entry 对 象 的 基本 方法 如 下 : 

Entry 对 象 =Entry (Windows 窗口 对 象 ) 

显示 Entry 对 象 的 方法 如 下 : 

Entry 对 象 .pack () 


2) 获取 Entry 组 件 的 内 容 

get0) 方 法 用 于 获取 单行 文本 框 内 输入 的 内 容 。 

设置 或 者 获取 Entry 组 件 内 容 也 可 以 使 用 StringVar() 对 象 来 完成 ,把 Entry 的 textvariable 
属性 设置 为 StringVar(0) 变 量 ， 再 通过 StringVar0 变 量 的 get0 和 set0 函 数 读 取 和 输出 相应 文 
本 内 容 。 例 如 : 

















Ss=StringVar () # 一 个 StringVar () 对 象 

s.set ("大 家 好 ， 这 是 测试 ") 

entryCd=Entry (root, textvariable=s) #Entry 组 件 显 示 “ 大 家 好 ， 这 是 测试 ” 
print (s.get ()) # 打 印 出 “大 家 好 ， 这 是 测试 ” 


3) Entry 的 常用 属性 

show: 如 果 设 置 为 字符 *， 则 输入 文本 框 内 的 显示 为 *， 用 于 密码 输入 。 
insertbackground: 插入 光标 的 颜色 ， 默 认为 black'。 

selectbackground 和 selectforeground: 选中 文本 的 背景 色 与 前 景色 。 

width: 组 件 的 宽度 〈 所 占 字符 个 数 )。 

他 : 字体 的 前 景 颜色 。 

bg: 背景 颜色 。 

state: 设置 组 件 状态 ， 默 认为 normal， 还 可 设置 为 disabled (禁用 组 件 ) 或 readonly 
(只 读 )。 


Python 还 提供 了 多 行文 本 框 组 件 Text， 用 于 输入 多 行内 容 和 显示 文本 。 其 使 用 方法 类 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
似 Entry， 请 读者 参考 Tkinter 手册 。 
@ 列表 框 组 件 Listbox 
列表 框 组 件 Listbox 用 于 显示 多 个 项 目 ， 并 且 人 允许 用 户 选择 一 个 或 多 个 项 目 。 
1) 创建 和 显示 Listbox 对 象 
创建 Listbox 对 象 的 基本 方法 如 下 : 


Listbox 对 象 =Listbox (Tkinter Windows 窗口 对 象 ) 
显示 Listbox 对 象 的 方法 如 下 : 
Listbox 对 象 .pack() 
2) 插入 文本 项 
用 户 可 以 使 用 insert() 方 法 向 列表 框 组件 中 插入 文本 项 ， 方 法 如 下 : 
Listbox 对 象 .insert (index, item) 
其 中 ，index 是 插入 文本 项 的 位 置 ， 如 果 在 尾部 插入 文本 项 ， 则 可 以 使 用 END;， 如 果 在 当 
前 选中 处 插入 文本 项 ， 则 可 以 使 用 ACTIVE。item 是 要 插入 的 文本 项 。 
3) 返回 选中 项 目的 索引 
Listbox 对 象 .curselection() 
返回 当前 选中 项 目的 索引 ， 结 果 为 元 组 。 
注意 : 索引 号 从 0 开始 ，0 表 示 第 1 项 。 
4) 删除 文本 项 
Listbox 对 象 .delete (first,1ast) 
删除 指定 范围 first~last 的 项 目 ， 当 不 指定 last 时 删除 1 个 项 目 。 
5) 获取 项 目 内 容 
Listbox 对象.get (first, last) 
返回 指定 范围 frst~last 的 项 目 ， 当 不 指定 last 时 仅 返 回 1 个 项 目 。 
6) 获取 项 目 个 数 


Listbox 对 象 .size () 


7) 获取 Listbox 内 容 
需要 使 用 listvariable 属性 为 Listbox 对 象 指定 一 个 对 应 的 变量 ， 例 如 : 


m=StringVar() 





listb=Listbox(root, listvariable=m) 
listb.pack() 
root .mainloop () 


指定 后 就 可 以 使 用 m.get0 方 法 获取 Listbox 对 象 中 的 内 容 了 。 
注意 : 如 果 允 许 用 户 选择 多 个 项 目 ， 需 要 将 Listbox 对 象 的 selectmode 属性 设置 为 
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MULTIPLE (表示 多 选 )， 而 设置 为 SINGLE 表示 单 选 。 


[ 贺 1-19 创建 从 一 个 列表 框 选择 内 容 添 加 到 另 一 个 列表 框 的 GUI 程序 。 





from tkinter import * # 导 入 Tkinter 库 
root=Tk () # 创 建 窗口 对 象 
def callbuttonl() : 

for i in listb.curselection(): ## 遍 历 选中 项 


listb2.insert (0,1istb.get (i))  # 添 加 到 右 侧 列表 框 


def callbutton2 () : 


for i in listb2.curselection(): # 遍 历 选中 项 
listb2.delete (i) # 从 右 侧 列表 框 中 删除 
# 创 建 两 个 列表 
listc' "pythons "php htm "SQL rr "java] 
listb=Listbox (root) # 创 建 两 个 列表 框 组 件 
listb2=Listbox(root) 
for item in 1i: # 左 侧 列表 框 组 件 插入 数据 


listb.insert (0,item) 
listb.grid(row=0,column=0,rowspan=2) ”将 列表 框 组 件 放置 到 窗口 对 象 中 
bl=Button (root, text=' 添 加 >>'，command=callbuttonl, width=20) 


# 创 建 Button 组 件 
b2=Button (root, text=' 删 除 <<'，command=callbutton2, width=20) 

# 创 建 Button 组 件 
bl.grid (row=0, column=1, rowspan=2) # 显 示 Button 组 件 
b2.grid(row=1, column=1, rowspan=2) # 显 示 Button 组 件 


listb2.grid (row=0,column=2, rowspan=2) 


root .mainloop () # 进 入 消息 循环 
以 上 代码 的 执行 结果 如 图 1-12 所 示 。 
tk ”和 9 | 





java php 
SQL python 
川 html | 
python 添 b>> 
| 删除 << 














图 1-12 含有 两 个 列表 框 组 件 的 GUI 程序 


人 @ 单 选 按钮 组 件 Radiobutton 和 复 选 框 组 件 Checkbutton 
单 选 按钮 组 件 Radiobutton 和 复 选 框 组 件 Checkbutton 分 别 用 于 实现 选项 的 单 选 和 复 选 


功能 。Radiobutton 用 于 从 同一 组 单 选 按钮 中 选择 一 个 单 选 按钮 (不 能 同时 选择 多 个 )。 
Radiobutton 可 以 显示 文本 ， 也 可 以 显示 图 像 。Checkbutton 用 于 选择 一 项 或 多 项 ， 同 样 
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| 喇 妥 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
Checkbutton 可 以 显示 文本 ， 也 可 以 显示 图 像 。 
1) 创建 和 显示 Radiobutton 对 象 
创建 Radiobutton 对 象 的 基本 方法 如 下 : 


Radiobutton 对 象 =Radiobutton (Windows 窗口 对 象 , text=Radiobutton 组 件 显示 的 文本 ) 
显示 Radiobutton 对 象 的 方法 如 下 : 
Radiobutton 对 象 .pack() 


用 户 可 以 使 用 variable 属性 为 Radiobutton 组 件 指定 一 个 对 应 的 变量 。 如 果 将 多 个 
Radiobutton 组 件 绑 定 到 同一 个 变量 ， 则 这 些 Radiobutton 组 件 属 于 一 个 分 组 。 分 组 后 需要 
使 用 value 设置 每 个 Radiobutton 组 件 的 值 ， 以 标识 该 项 目 是 否 被 选中 。 

2) Radiobutton 组 件 的 常用 属性 

。 variable: 单 选 按钮 索引 变量 ， 通 过 变量 的 值 确定 哪个 单 选 按钮 被 选中 。 一 组 单 选 按 

钮 使 用 同一 个 索引 变量 。 

。 value: 单 选 按钮 选中 时 变量 的 值 。 

。 command: 单 选 按钮 选中 时 执行 的 命令 (函数 )。 

3) Radiobutton 组 件 的 方法 

。 deselect(): 取消 选择 。 

。 select(): 选择 。 

。 invoke(): 调用 单 选 按钮 command 指定 的 回调 函数 。 

4) 创建 和 显示 Checkbutton 对 象 

创建 Checkbutton 对 象 的 基本 方法 如 下 : 

Checkbutton 对 象 =<Checkbutton (Tkinter Windows 窗口 对 象 ,text=Checkbutton 组 件 显 
示 的 文本 ，command= 单 击 checkbutton 按钮 所 调用 的 回调 函数 ) 


显示 Checkbutton 对 象 的 方法 如 下 : 
Checkbutton 对 象 .pack () 


5) Checkbutton 组 件 的 常用 属性 
。 variable: 复 选 框 索 引 变 量 ， 通 过 变量 的 值 确 定 哪些 复 选 框 被 选中 。 每 个 复 选 框 使 用 
不 同 的 变量 ， 使 复 选 框 之 间 相互 独立 。 

。 onvalue: 复 选 框 选中 (有效) 时 变量 的 值 。 

。 offvalue: 复 选 框 未 选中 无效 ) 时 变量 的 值 。 

。 command: 复 选 框 选中 时 执行 的 命令 (函数 )。 

6) 获取 Checkbutton 组 件 的 状态 

为 了 获取 Checkbutton 组 件 是 否 被 选中 ， 需 要 使 用 variable 属性 为 Checkbutton 组 件 指 
定 一 个 对 应 变量 ， 例 如 : 

C=tkinter .IntVar() 


c.set (2) 
check=tkinter.Checkbutton (root, text=' 喜 欢 ', variable=c, onvalue=1, 
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offvalue=2) ##1 为 选中 ，2 为 没 选中 
check.pack() 


指定 变量 后 ， 可 以 使 用 c.get0 获 取 复 选 框 的 状态 值 ， 也 可 以 使 用 c.set0 设 置 复 选 框 
的 状态 。 例 如 设置 check 对 象 为 没 选中 状态 ， 代 码 如 下 : 


c.set (2) #1 为 选中 ，2 为 没 选中 ， 设 置 为 2 就 表示 没 选中 状态 


获取 单 选 按钮 (了 Radiobutton ) 状态 的 方法 同上 。 
[ 贺 1-20 创建 使 用 单 选 按钮 (Radiobutton) 组 件 选择 国家 的 程序 。 























import tkinter 

root=tkinter.Tk() 

r=tkinter.SstringVar () # 创 建 StringVar 对 象 
r.set('1') # 设 置 初始 值 为 “1”， 初始 选中 “中 国 ” 
radio=tkinter.Radiobutton (root, variable=r, value="'1' ,text=' 中 国 ') 
radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='2',text=' 美 国 ') 
radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='3',text=' 日 本 ') 
radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='4',text=' 加 拿 大 ') 
radio.pack() 

radio=tkinter.Radiobutton (root, variable=r, value='5', text=' 韩 国 ') 
radio.pack() 

root .mainloop () 


print (r.get ()) # 获 取 被 选中 单 选 按钮 变量 值 


以 上 代码 的 执行 结果 如 图 1-13 所 示 。 选 中 日 本 后 打印 出 3。 
@@ 菜单 组 件 Menu 
图 形 用 户 界 面 应 用 程序 通常 提供 菜单 , 菜单 包含 名 种 按照 主 
题 分 组 的 基本 命令 。 通常 ， 图 形 用 户 界 面 应 用 程序 包括 两 种 类 型 
的 菜单 。 

(1) 主 菜单 : 提供 窗 体 的 菜单 系统 。 通过 单 击 可 下 拉 出 子 菜 
单 ， 选 择 命令 可 执行 相关 的 操作 。 常 用 的 主 菜单 一 般 包 括 文件 、 
编辑 、 视 图 、 帮 助 等 。 图 1-13 单 选 按 钮 示例 程序 

(2) 上 下 文 菜 单 〈 也 称 为 快捷 菜单 ): 通过 右 击 某 对 象 而 弹出 的 菜单 ， 一 般 为 与 该 对 
象 相关 的 常用 菜单 命令 ， 例 如 剪 切 、 复 制 、 粘 贴 等 。 

创建 Menu 对 象 的 基本 方法 如 下 : 

Menu 对 象 =Menu (Windows 窗口 对 象 ) 

将 Menu 对 象 显示 在 窗口 中 的 方法 如 下 : 


Windows 窗口 对 象 [ "menu']=Menu 对 象 
Windows 窗口 对 象 .mainloop () 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


[加 121 使 用 Menu 组 件 的 简单 例子 ， 运 行 效果 如 图 1-14 所 示 。 




















from tkinter import * 


root=Tk () 


def hello(): # 菜 单项 事件 函数 ， 每 个 菜单 项 可 以 单独 写 


print ("你 单 击 主 菜单 ") 


m=Menu (root) 


for item in [' 文 件 ', ' 编 辑 ', ' 视 图 '] : # 添 加 菜单 项 

m.add command (label=item, command=hello) 
root['menu' ]=m # 附 加 主 菜 单 到 窗口 
root .mainloop () 


@ 消息 窗口 组 件 Messagebox 

消息 窗口 组 件 Messagebox 用 于 弹出 提示 框 向 用 
户 进行 告警 ， 或 让 用 户 选 择 下 一 步 如 何 操作 。 消 息 
框 包括 很 多 类 型 ， 常 用 的 有 info、warming、error、 
yesno、okcancel 等 ， 包 含 不 同 的 图 标 、 按 钮 以 及 弹 
出 提示 音 。 




















贺 1-22 演示 各 消息 框 的 程序 ， 运 行 效果 如 ” 因 1 4 使 用 Menu 组 件 的 菜单 运行 效果 


图 1-15 所 示 。 


import tkinter as tk 
from tkinter import messagebox as msgbox 
def btnl clicked() : 
msgbox.showinfo("Info", "Showinfo test.") 
def btn2 clicked() : 
msgbox .showwarning ("Warning", "Showwarning test.") 
def btn3 clicked() : 
msgbox.showerror ("Error", "Showerror test.") 
def btn4 clicked() : 
msgbox.askquestion ("Question", "Askquestion test.") 
def btn5 clicked() : 
msgbox .askokcancel ("OkCancel", "Rskokcancel test.") 
def btn6 clicked() : 
msgbox .askyesno ("YesNo", "Rskyesno test.") 
def btn7 clicked() : 
msgbox .askretrycancel ("Retry", "Askretrycancel test.") 
root=tk.Tk() 
root.title ("MsgBox Test") 
btnl=tk.Button (root, text="showinfo", command=btnl clicked) 
btnl .pack (fill=tk.xX) 
btn2=tk.Button (root, text="showwarning", command=btn2 clicked) 
btn2.pack (fill=tk .Xx) 
btn3=tk.Button (root, text="showerror", command=btn3 clicked) 
btn3 .pack (fill=tk.xXx) 
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btn4=tk.Button (root, text="askquestion", command=btn4 clicked) 
btn4.pack (fill=tk.xXx) 

btn5=tk.Button (root, text="askokcancel", command=btn5 clicked) 
btn5.pack (fill=tk.X) 

btn6=tk.Button (root, text="askyesno", command=btn6 clicked) 
btn6.pack (fil1=tk.X) 

btn7=tk.Button (root, text="askretrycancel", command=btn7 clicked) 
btn7.pack (fill=tk .xX) 

root .mainloop () 











askquestion | 


askokcancel 

















askretrycance| 








图 1-15 消息 窗口 的 运行 效果 


和 @@ 框架 组 件 Frame 

Frame 组 件 是 框架 组 件 ， 在 分 组 组 织 其 他 组 件 的 过 程 中 是 非常 重要 的 ， 负 责 安 排 其 他 
组 件 的 位 置 。Frame 组 件 在 屏幕 上 显示 为 一 个 矩形 区 域 ， 作 为 显示 其 他 组 件 的 容器 。 

1) 创建 和 显示 Frame 对 象 

创建 Frame 对 象 的 基本 方法 如 下 : 


Frame 对 象 =Frame (窗口 对 象 ，height= 高 度 , width= 宽 度 , bg= 背 景色 ，...) 
例如 ， 创 建 第 1 个 Frame 组 件 ， 其 高 为 100， 宽 为 400， 背 景色 为 绿色 。 
fl=Frame (root, height=100,width=400,bg='green') 

显示 Frame 对 象 的 方法 如 下 : 

Frame 对 象 .pack() 


2) 向 Frame 组 件 中 添加 组 件 
在 创建 组 件 时 指定 其 容器 为 Frame 组 件 即 可 ， 例 如 : 


Label (Frame 对 象 ,text='Hello') .pack()  # 向 Frame 组 件 中 添加 一 个 Label 组 件 


3) LabelFrame 组 件 
LabelFrame 组 件 是 有 标题 的 Frame 组 件 ,可 以 使 用 text 属性 设置 LabelFrame 组 件 的 标 
题 ， 方 法 如 下 : 


LabelFrame (窗口 对 象 ，height= 高 度 , width= 宽 度 ,text= 标 题 ) .pack () 
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| 咏 芝 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


贺 1-23 使 用 两 个 Frame 组 件 和 一 个 LabelFrame 组 件 的 例子 。 


from tkinter import * 

















root=Tk () # 创 建 窗口 对 象 

Foot .title ("使 用 Frame 组 件 的 例子 ") # 设 置 窗口 标题 
£1=Frame (root) # 创 建 第 1 个 Frame 组 件 
£1.pack() 

£2=Frame (root) # 创 建 第 2 个 Frame 组 件 
f2.pack() 


f3=LabelFrame (root, text=' 第 3 个 Frame') 

# 第 3 个 LabelFrame 组 件 ， 放 置 在 窗口 底部 
f3.pack(side=BOTTOM) 
Fredbutton=Button (fl1, text="Red", fg="red") 
redbutton .pack (side=LEFT) 
brownbutton=Button (fl, text="Brown", fg="brown") 
brownbutton.pack (side=LEFT) 
bluebutton=Button (fl, text="Blue", fg="blue") 
bluebutton.pack (side=LEFT) 
blackbutton=Button (f2, text="Black", fg="black") 
blackbutton.pack() 
greenbutton=Button (f3, text="Green", fg="Green") 
greenbutton.pack() 
Foot .mainloop () 


以 上 代码 通过 Frame 框架 把 5 个 按钮 分 成 3 个 区 域 ， 第 1 个 区 域 3 个 按钮 ， 第 2 个 区 
域 1 个 按钮 ， 第 3 个 区 域 1 个 按钮 ， 运 行 效果 如 图 1-16 所 示 。 


办 使 用 Fra | 


rd 


| Red | Brown | Blue 
Black 


第 3 个 Frame 


Green 


图 1-16 Frame 框架 的 运行 效果 























4) 刷新 Frame 
用 Python 做 GUI 图 形 界面 ， 可 以 使 用 after( 方 法 每 隔 几 秒 刷 新 GUI 图 形 界面 。 例 如 
下 面 的 代码 实现 计数 器 功能 ， 并 且 文 字 背 景色 不 断 改 变 。 


from tkinter import * 














colors=('red', 'orange'， 'yellow', 'green', 'blue', 'purple') 
root=Tk () 

f=Frame (root, height=200, width=200) 

f.color=0 

f['bg']=colors[f.color] # 设 置 框架 背景 色 

labl=Label (f, text="0"') 
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labl.pack() 
def foo() : 
f.color=(f.color+1)$ (len(colors)) 
labl['bg']=colors[f.color] 
labl['text']=str (int (labl['text'])+1) 
f.after(500，fo0)  # 隔 500 ms 执行 foo () 函数 刷新 屏幕 
f.pack() 
f.after(500, foo) 
Foot .mainloop() 
例如 开发 移动 电子 广告 效果 就 可 以 使 用 after() 方 法 实现 不 断 移动 lab1。 
from tkinter import * 
root=TKk () 
f=Frame (root, height=200, width=200) 
labl=Label (f, text=' 欢 迎 参 观 中原 工 学 院 ') 
x=0 
def foo(): 
global x 
X=X+10 
if x>200: 
X=0 
labl .place (x=x, y=0) 
f.after(500，foo) “ # 隔 500 ms 执行 foo () 函数 刷新 屏幕 


f.pack() 
f.after(500, foo) 
Foot .mainloop () 


运行 程序 可 见 “ 欢 迎 参观 中 原 工 学 院 ” 不 停 地 从 左 向 右 移动 ， 出 了 窗口 右 侧 以 后 重新 














从 左 侧 出 现 。 利 用 此 技巧 可 以 开发 类 似 的 贪 吃 蛇 游戏 ， 借 助 after0 方 法 实现 不 断 改 变 蛇 的 
位 置 ， 从 而 达到 蛇 移动 的 效果 。 


1.4.4 Tkinter 字体 


通过 组 件 的 font 属性 可 以 设置 其 显示 文本 的 字体 ， 注 意 在 设置 组 件 字体 前 首先 要 能 表 


示 一 个 字体 。 


@ 通过 元 组 表示 字体 
通过 3 个 元 素 的 元 组 可 以 表示 字体 
(font family,size,modifiers) 


作为 一 个 元 组 的 第 1 个 元 素 的 font family 是 字体 名 ; size 为 字体 大 小 ， 单 位 为 point; 


modifiers 为 包含 粗 体 、 斜 体 、 下 画 线 的 样式 修饰 符 。 


例如 : 


("Times New Roman ", "16") #16 点 阵 的 Times 字体 
("Times New Roman "，"24"，"bold italic")#24 点 阵 的 Times 字体 ， 且 为 粗 体 、 斜 体 
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| 此 要 项 目 案例 开发 





有 空 


其 中 
体 ; 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


贺 1-24 通过 元 组 表示 字体 设置 标签 的 字体 ， 运 行 效果 如 图 1-17 所 示 。 


from tkinter import * 

root=Tk () 

# 创 建 Label 

for ft in('Arial', ('Courier New',19,'italic'), ('Comic Sans MS',),'Fixdsys', 

('MS Sans Serif',), ('MS Serif',),'Symbol','System', ('Times New Roman',), 'Verdana'): 
Label (root, text="'hello sticky',font=ft) .grid() 














root .mainloop () 
这 个 程序 在 Windows 上 测试 字体 显示 , 注意 字体 中 包含 
格 的 字体 名 称 必须 指定 为 元 组 类 型 。 helo sticky 
@ 通过 Font 对 象 表示 字体 ee 
s hello sticky 
使 用 tkFont.Font 来 创建 字体 ， 格 式 如 下 : | hello sticky 
hello sticky 
ft=tkFont .Font (family=' 字 体 名 ', size, weight, 这 sticky 
slant, underline, overstrike) neXho onyxy 
hello sticky 
，Size 为 字体 大 小 ; weight='bold' 或 mormal，'bold' 为 粗 | helo sticky 
slant='italic' 或 mormal'，'italic' 为 斜体 ; underline=1 或 0， ey 











1 为 下 画 线 ，overstrike=1 或 0，1 为 删除 线 。 图 1-17 缩放 图 形 对 象 运行 效果 
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ft=Font (family='Helvetica',size=36,weight='bold') 
加 1-25 通过 Font 对 象 设置 标签 字体 ， 运 行 效果 如 图 1-18 所 示 。 
# 通 过 Font 对 象 来 创建 字体 


from tkinter import * 

import tkinter.font # 引 入 字体 模块 
root=TKk () 

# 指 定 字体 名 称 、 大 小 、 样 式 

ft=tkinter.font.Font (family='Fixdsys',size=20,weight='bold') 

Label (root, text='hello sticky',font=ft) .grid() # 创 建 一 个 Label 

root .mainloop () 


通过 tkFont. familiesO 函 数 可 以 返回 所 有 可 用 的 字体 。 





from tkinter import * 3 

import tkinter.font # 引 入 字体 模块 

root=TKk () 

print (tkinter.font.families()) 图 1-18 通过 Font 对 象 设置 标签 字体 
输出 结果 : 


('Forte', 'Felix Titling', 'Eras Medium ITC', 'Eras Light ITC', 'Eras Demi 
ITC', 'Eras Bold ITC', 'Engravers MT', 'Elephant', 'Edwardian Script ITC', 
"Cur1z MT', 'Copperplate Gothic Light', 'Copperplate Gothic Bold', 'Century 
Schoolbook', 'Castellar', 'Calisto MT', 'Bookman Old Style', 'Bodoni MT 
Condensed', 'Bodoni MT Black', 'Bodoni MT', 'Blackadder ITC', 'Arial Rounded 
MT Bold', 'Agency FB', ‘'Bookshelf Symbol 7', 'MS Reference Sans Serif', 'MS 
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Reference Specialty'，"Berlin Sans FB Demi', 'Tw Cen MT Condensed Extra Bold', 
"Calibri Light'，'Bitstream Vera Sans Mono'， ' 方 正 兰 亭 超 细 黑 简体 "'，' 方正 兰亭 
超 细 黑 简体 "， 'Buxton Sketch'， 'Segoe Marker', 'SketchFlow Print') 


1.4.5 ”Python 事件 处 理 





所 谓 事件 (Event)， 就 是 程序 上 发 生 的 事 。 例 如 用 户 敲 击 键盘 上 的 某 人 
一 个 键 或 是 单 击 、 移 动 鼠 标 。 对 于 这 些 事 件 ， 程 序 需要 做 出 反应 。Tkinter 和 
提供 的 组 件 通常 都 有 自己 可 以 识别 的 事件 。 例 如 当 按 钮 被 单 击 时 执行 特定 ee 





操作 ， 或 者 当 一 个 输入 栏 成 为 焦点 ， 而 用 户 又 敲 击 了 键盘 上 的 某 些 键 时 ， 用 户 所 输入 的 内 
容 就 会 显示 在 输入 栏 内 。 

程序 可 以 使 用 事件 处 理 函 数 来 指定 当 触 发 菜 个 事件 时 所 做 的 反应 (操作)。 

@ 事件 类 型 
事件 类 型 的 通用 格式 如 下 : 


<[modifier-]…type[-detail]> 

















事件 类 型 必须 放置 于 尖 括 号 <> 内 。type 描述 了 类 型 , 例如 键盘 按键 、 鼠 标 单 击 。 modifier 
用 于 组 合 键 定 义 ， 例 如 Control、Alt。detail 用 于 明确 定义 是 哪 一 个 键 或 按钮 的 事件 ， 例 如 
1 表示 鼠标 左 键 、2 表示 鼠标 中 键 、3 表示 鼠标 右键 。 





























举例 如 下 : 
<Button-1> # 按 下 鼠标 左 键 
<KeyPress-A> # 按 下 键盘 上 的 A 键 
<Control-Shift-KeyPress-A> # 同 时 按 下 了 control、Shift、A 3 个 键 
在 Python 中 ， 键 盘 事 件 见 表 1-6， 鼠 标 事件 见 表 1-7， 窗 体 事件 见 表 1-8。 
表 1-6 键盘 事件 
名 称 描 述 
KeyPress 按 下 键盘 上 的 某 键 时 触发 ， 可 以 在 detail 部 分 指定 是 哪个 键 
KeyRelease 释放 键盘 上 的 某 键 时 触发 ， 可 以 在 detail 部 分 指定 是 哪个 键 
表 1-7 鼠标 事件 
名 称 描 述 
ButtonPress 或 Button 按 下 鼠标 某 键 ， 可 以 在 detail 部 分 指定 是 哪个 键 
ButtonRelease 释放 鼠标 某 键 ， 可 以 在 detail 部 分 指定 是 哪个 键 
Motion 点 中 组 件 的 同时 拖 电 组 件 移动 时 触发 
Enter 当 鼠 标 指针 移 进 某 组 件 时 触发 
Leave 当 鼠 标 指针 移出 某 组 件 时 触发 
MouseWheel 当 鼠 标 滚轮 滚动 时 触发 
表 1-8 窗 体 事件 
名 称 描 述 
Visibility | 当 组 件 变 为 可 视 状 态 时 触发 
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| 辣 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 























续 表 
名 称 描 述 
Unmap 当 组 件 由 显示 状态 变 为 隐藏 状态 时 触发 
Map 当 组 件 由 隐藏 状态 变 为 显示 状态 时 触发 
Expose 当 组 件 从 原本 被 其 他 组 件 遮 盖 的 状态 中 暴露 出 来 时 触发 
FocusIn 当 组 件 获 得 焦点 时 触发 
FocusOut 当 组 件 失去 焦点 时 触发 
Configure 当 改 变 组 件 大 小 时 触发 ， 例 如 拖 钨 窗 体 边缘 
Property 当 窗 体 的 属性 被 删除 或 改变 时 触发 ， 属 于 Tk 的 核心 事件 
Destroy 当 组 件 被 销毁 时 触发 
A 与 组 件 选项 中 的 state 项 有 关 ， 表 示 组 件 由 不 可 用 转 为 可 用 ， 例 如 按钮 由 


disabled (灰色 ) 转 为 enabled 








与 组 件 选项 中 的 state 项 有 关 ， 表 示 组 件 由 可 用 转 为 不 可 用 ， 例 如 按钮 由 


Deactivate enabled 转 为 disabled (灰色 ) 


modifier 组 合 键 定义 中 常用 的 修饰 符 见 表 1-9。 
表 1-9 组 合 键 定义 中 常用 的 修饰 符 


修 饰 符 描 述 
Alt Alt 键 按 下 
Any 任何 按键 按 下 ， 例 如 <Any-KeyPress> 
Control Control 键 按 下 
Double 两 个 事件 在 短 时 间 内 发 生 ， 例 如 双击 鼠标 左 键 <Double-Button-1> 
Lock Caps Lock 键 按 下 
Shift Shift 键 按 下 
Triple 类 似 于 Double，3 个 事件 短 时 间 内 发 生 





可 以 用 短 格式 表示 事件 ， 例 如 <1> 等 同 于 <Button-1>、<x> 等 同 于 <KeyPress-x>。 
对 于 大 多 数 的 单字 符 按键 ， 用 户 还 可 以 忽略 “<>” 符 号 ,但 是 空格 键 和 尖 括 号 键 不 能 


这 样 做 正确 的 表示 分 别 为 <space>、<less>)。 


@ 事件 绑 定 
程序 建立 一 个 处 理 某 一 事件 的 事件 处 理 函数 称 为 绑 定 。 
1) 创建 组 件 对 象 时 指定 
在 创建 组 件 对 象 实例 时 ， 可 以 通过 其 命名 参数 command 指定 事件 处 理 函数 。 例 如 : 
def callback() : # 事 件 处 理 函 数 
showinfo ("Python command"," 人 生 苦 短 ， 我 用 Python") 
Bul=Button (root，text=" 设 置 command 事件 调用 命令 ", command=callback) 
Bul.pack() 


2) 实例 绑 定 
调用 组 件 对 象 实例 方法 bind0 可 以 为 指定 组 件 实例 绑 定 事件 ， 这 是 最 常用 的 事件 绑 定 





方式 。 


组 件 对 象 实例 名 .bind ("< 事件 类 型 >"， 事 件 处 理 函 数 ) 
例如 ， 假 如 声明 了 一 个 名 为 canvas 的 Canvas 组 件 对 象 ， 想 在 canvas 上 按 下 鼠标 左 键 
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时 画 一 条 线 ， 可 以 这 样 实现 : 
canvas.bind("<Button-1>", drawline) 


其 中 ，bind 函数 的 第 1 个 参数 是 事件 描述 符 ， 指 定 无 论 什么 时 候 在 canvas 上 ， 当 按 下 鼠标 
左 键 时 就 调用 事件 处 理 函 数 drawline 进行 画 线 的 任务 。 特 别 需要 说 明 的 是 ，drawline 后 面 
的 圆 括号 是 省 略 的 ，Tkinter 会 将 此 函数 填 入 相关 参数 后 调用 运行 ， 在 这 里 只 是 声明 
而 已 。 

3) 标识 绑 定 

在 Canvas 画布 中 绘制 各 种 图 形 , 将 图 形 与 事件 绑 定 可 以 使 用 标识 绑 定 函 数 tag_bind()。 
预先 为 图 形 定 义 标识 tag 后 ， 通 过 标识 tag 来 绑 定 事件 。 例 如 : 

cv.tag bind('rl','<Button-1>',printRect) 

[ 圆 1-26 标识 绑 定 的 例子 。 


from tkinter import * 
Foot=TK() 
def printRect (event) : 

print ('rectangle 左 键 事件 ') 
def PrintRect2 (event): 

Print ('rectangle 右键 事件 ') 
def printLine (event): 

print ('Line 事件 ') 


















































cv=Canvas (root, bg='white') # 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
rtl=cv.create rectangle( 

oa TO 

width=8, tags="'r1') 
cv.tag bind('rl','<Button-1>',printRect) # 绑 定 item 与 鼠标 左 键 事件 
cv.tag bind('rl', '<Button-3>',printRect2) “ # 绑 定 itenm 与 鼠标 右键 事件 
# 创 建 一 个 1ine， 并 将 其 tags 设置 为 'r2' 
cv.create line(180,70,280,70,width=10,tags="'r2') 
cv.tag bind('r2','<Button-1>',printLine) # 绑 定 item 与 鼠标 左 键 事件 
cv.pack() 
Foot .mainloop () 


在 这 个 示例 中 , 单 击 到 算 形 的 边框 时 才 会 触发 事件 , 矩形 既 响 应 鼠标 左 键 又 响应 右键 。 
当 用 鼠标 左 键 单 击 矩 形 边框 时 出 现 “rectangle 左 键 事件 ”信息 ， 用 鼠标 右键 单 击 和 矩形 边框 
时 出 现 “rectangle 右键 事件 ”信息 ， 用 鼠标 左 键 单 击 直线 时 出 现 “Line 事件 ”信息 。 

@ 事件 处 理 函 数 

1) 定义 事件 处 理 函 数 
事件 处 理 函数 往往 带 有 一 个 event 参数 , 在 触发 事件 调用 事件 处 理 函 数 时 将 传递 Event 
对 象 实例 。 

def callback (event) : # 事 件 处 理 函数 

showinfo ("Python command"," 人 生 苦 短 ， 我 用 Python") 
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| 项 目 案 


例 开发 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


2) Event 对 象 的 参数 


Event 对 象 可 以 获取 各 种 相关 参数 ， 主 要 参数 如 表 1-10 所 示 。 


参数 


表 1-10 “Event 对 象 的 主要 参数 
说 明 





xy 
.xX IOOt,.y_root 


鼠标 相对 于 组 件 对 象 左上 角 的 坐标 
鼠标 相对 于 屏幕 左上 角 的 坐标 


字符 串 命 名 按键 ， 例 如 Escape、F1 一 F12、Scroll Lock、Pause、Insert、Delete、 




















keysym Home、Prior (这 个 是 page up) 、Next (这 个 是 page down) 、End、Up、Right、 
Left、 Down、 Shift L、 Shift R、Control L、 Control R、 Alt L、 Alt R、 Win L 

.keysym num 数字 代码 命名 按键 

二 键 码 ， 但 是 它 不 能 反映 事件 前 级 Alt、Control、Shift、Lock， 并 且 它 不 区 分 大 小 
写 按键 ， 即 输入 a 和 A 是 相同 的 键 码 

.time 时 间 

.type 事件 类 型 

.widget 触发 事件 的 对 应 组 件 

.char 字符 


Event 对 象 按 键 的 详细 信息 如 表 1-11 所 示 。 


-keysym 
Alt L 
Alt R 
BackSpace 
Cancel 
F1~F11 
Print 


表 1-11 ”Event 对 象 按键 的 详细 信息 


| 10 | 55387 
67 一 77 65470 一 65480 
[LI | 637 | 





说 明 
左手 边 的 Alt 键 
右手 边 的 Alt 键 
BackSpace 键 
Pause Break 键 
功能 键 F1 一 F11 
打印 屏幕 键 


贺 1-27 触发 keyPress 键盘 事件 的 例子 ， 运 行 效果 如 图 1-19 所 示 。 


from tkinter import * 


def printkey (event): 


print(' 你 按 下 了 : '+event .char) 


root=TKk () 


entry=Entry (root) 


# 实 例 化 tk 
# 实 例 化 一 个 单行 输入 框 


# 给 输入 框 绑 定 按键 监听 事件 <KeyPress> 为 监听 任何 按键 
#<KeyPress-x> 为 监听 某 键 x， 例 如 <KeyPress-A> 为 监听 A、<KeyPress-Return> 为 监听 回 车 
entry.bind('<KeyPress>', printkey) 


entry.pack() 


root .mainloop () 
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# 显 示 窗 体 


你 按 下 了 : h 
:Ss 
必 小 了 = 
SE: 1 kk 【一 二 号 -医治 
信人 了: o 
ET: 家 
校 下 了 : m 
你 KR7: 3 
图 1-19 keyPress 键盘 事件 运行 效果 


# 导 入 Tkinter 库 
# 定 义 的 函数 监听 键盘 事件 
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[ 贺 1-28 获取 鼠标 单 击 标签 时 坐标 的 鼠标 事件 例子 ， 运 行 效果 如 图 1-20 所 示 。 


from tkinter import * # 导 入 Tkinter 库 
def leftclick(event) : # 定 义 的 函数 监听 鼠标 事件 
print ("x 轴 坐 标 :"，event .x) 
Print ("y 轴 坐 标 :"，event.y) 
print ("相对 于 屏幕 左上 角 x 轴 坐 标 :"，event .x root) 
print ("相对 于 屏幕 左上 角 y 轴 坐 标 :"，event .y root) 





root=Tk () # 实 例 化 tk 
lab=Label (root, text="hello") # 实 例 化 一 个 Label 
lab.pack () # 显 示 Label 组 件 
# 给 Label 绑 定 鼠标 监听 事件 
lab.bind("<Button-1>",1LeftClick) 
root .mainloop () # 显 示 窗 体 
A 角 未: 132 
上 角 x 轴 坐标 : 1 
a 91 
bi 
由 坐标 : 11 
Si 好 
xj 抽 生 怀 : 
坐标 : 6 
和 上 角 x 轴 坐标 : 104 
相遇 是 上 久生 村 : 吉 











而 


1-20 鼠标 事件 运行 效果 


1.4.6 ”图 形 宽 面 设计 应 用 案例 一 一 开发 猜 数 字 游戏 


【案例 】 使 用 Tkinter 开发 猜 数 字 游 戏 ， 运 行 效果 如 图 1-21 所 示 。 

在 该 游戏 中 ， 计 算 机 随机 生成 1024 以 内 的 数字 ， 玩 家 去 猜 ， 猜 的 数字 过 大 、 过 小 都 会 给 
出 提示 ， 程 序 要 统计 玩家 猜 的 次 数 。 

import tkinter as tk 

import random 


number=random.randint (0,1024) # 玩 家 要 猜 的 数字 

running=True 

num=0 # 猜 的 次 数 

nmaxn=1024 # 提 示 猜 测 范围 的 最 大 数 

nminn=0 # 提 示 猜 测 范围 的 最 小 数 

def eBtnclose (event) : # “关闭” 按钮 事件 函数 
root .destroy () 

def eBtnGuess (event) : #“ 猜 ”按钮 事件 函数 
global nmaxn # 全 局 变量 


global nminn 
global num 
global running 
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| 泡 家 项 目 案例 开 


从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


if running: 


val a=int (entry a-get()) # 获 取 猜 的 数字 并 转换 成 数字 


if val a==number: 
labelqval (" 恭 喜 答 对 了 ! ") 
num+=1 
running=False 


numGuess () # 显 示 猜 的 次 数 
elif val a<number: # 猜 小 了 
if val a>nminn: 
nminn=val a # 修 改 提示 猜测 范围 的 最 小 数 
num+=1 


labelqval ("小 了 哦 ,请 输入 "+str (nminn) +" 到 "+str (nmaxn)+" 之 间 任 意 


整数 : ") 
SlLgas 
if val a<nmaxn: 


nmaxn=val a # 修 改 提示 猜测 范围 的 最 大 数 


num+=1 


labelqval ("大 了 哦 ,请 输入 "+str (nminn)+" 到 "+str (nmaxn)+" 之 间 任 意 


整数 : ") 
else: 
labelqval(' 你 已 经 答对 啦 ...') 
# 显 示 猜 的 次 数 


def numGuess () : 
if num==1: 
labelqval (' 一 次 答对 ! ') 
elif num<10: 


labelqval ('== 十 次 以 内 就 答对 了 牛 。。。 尝 试 次 数 : '+str (num) ) 


Sloe 


labelqval(' 好 吧 ， 您 都 试 了 超过 10 次 了 。。。。 尝 试 次 数 : '+str (num) ) 


def labelqval (vText): 
label val q.config(label val q,text=vText) 


Foot=tk.Tk(className=" 猜 数字 游戏 ") 

Froot .geometry ("400X90+200+200") 
label val q=tk.Label (root, width="80") 
label val q.pack (side="top") 


entry a=tk.Entry (root,width="40") 
btnGuess=tk.Button (oot,text=" 猜 ") 
entry a.pack (side="left") 

entry a.bind('<Return>',eBtnGuess) 
btnGuess.bind('<Button-1>',eBtnGuess) 
btnGuess.pack (side="]left") 


# 修 改 提示 标签 文字 


# 提 示 标 签 


# 单 行 输入 文本 框 


#“ 猜 ”按钮 


# 绑 定 事件 
#“ 猜 ”按钮 


或 关机 后 就 会 消失 。 如 果 想 要 在 下 次 开机 运行 程序 时 还 使 用 同样 的 数据 ， 
就 需要 把 数据 存储 在 不 易 失 的 存储 介质 中 ， 例 如 硬盘 、 光 盘 或 UU 盘 里 ， 不 
易 失 存储 介质 上 的 数据 保存 在 以 存储 路 径 命 名 的 文件 中 。 通 过 读 / 写 文件 ， 
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btnClose=tk-Button (root, text=" 关 闭 ") ##“ 关 闭 ” 按 钮 
btnClose.bind('<Button-1>',eBtnClose) 

btnClose.pack (side="]left") 

labelqval ("请 输入 0 到 1024 之 间 任 意 整数 : ") 

entry a.focus set() 

print (number) 

Foot .mainloop() 





小 了 哦 请 绽 入 100 到 567 之 间 任 齐整 数 : 


a 





图 1-21 猜 数 字 游 戏 运行 效果 


1.5 ”Python 文件 的 使 用 


在 程序 运行 时 ， 数 据 保存 在 内 存 的 变量 里 。 内 存 中 的 数据 在 程序 结束 ” 国 





程序 就 可 以 在 运行 时 保存 数据 。 本 节 学 习 使 用 Python 在 磁盘 上 创建 、 读 / ”视频 讲解 


写 以 及 关闭 文件 。 











使 用 文件 跟 人 们 在 平时 生活 中 使 用 记事 本 很 相似 。 在 使 用 记事 本 时 需要 先 打开 本 子 ， 





使 用 之 后 要 合 上 它 。 在 打开 记事 本 后 ， 既 可 以 读 取 信息 ， 也 可 以 向 本 子 里 写 。 不 管 是 哪 种 
情况 ， 都 需要 知道 在 哪里 进行 读 / 写 。 在 记事 本 中 既 可 以 一 页 一 页 从 头 到 尾 地 读 ， 也 可 以 直 


接 跳 转 到 需要 的 地 方 。 


外 存 传输 到 内 存 的 过 程 称 为 读 操作 ， 将 数据 从 内 存 传输 到 外 存 的 过 程 称 为 ” 国 8 
写 操作 。 








在 Python 中 对 文件 的 操作 通常 按照 以 下 3 个 步骤 进行 : 
(1) 使 用 open0 函 数 打 开 (或 建立 ) 文件 ， 返 回 一 个 file 对 象 。 
(2) 使 用 file 对 象 的 读 / 写 方法 对 文件 进行 读 / 写 操作 。 其 中 ， 将 数据 从 








(3) 使 用 名 e 对 象 的 close0 方 法 关闭 文件 。 i 
1.5.1 打开 /建立 文件 视频 讲解 


在 Python 中 要 访问 文件 ,必须 打开 Python Shell 与 磁盘 上 文件 之 间 的 连接 ,在 使 用 open() 


函数 打开 或 建立 文件 时 会 建立 文件 和 使 用 它 的 程序 之 间 的 连接 ， 并 返回 代表 连接 的 文件 对 
象 ， 通 过 文件 对 象 就 可 以 在 文件 所 在 的 磁盘 和 程序 之 间 传 递 文件 内 容 ， 执 行文 件 上 的 所 有 
后 续 操作 。 文 件 对 象 有 时 也 称 为 文件 描述 符 或 文件 流 。 
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| 基本 项 目 案例 开发 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 

在 建立 了 Python 程序 和 文件 之 间 的 连接 后 就 创建 了 “ 流 ”数据 ， 如 图 1-22 所 示 。 通 
常 ， 程 序 使 用 输入 流 读 出 数据 ， 使 用 输出 流 写 入 数据 ， 就 好 像 数 据 流入 到 程序 并 从 程序 中 
流出 。 在 打开 文件 后 才能 读 或 写 ( 或 读 并 且 写 ) 文件 内 容 。 




















输入 设备 输出 设备 
和 输入 流 输出 流 
执行 程序 
标准 输入 /输出 
输入 流 输出 流 
输入 文件 执行 程序 输出 文件 
文件 输入 /输出 


图 1-22 输入 /输出 流 
open0) 函 数 用 来 打开 文件 。open() 函 数 需 要 一 个 字符 串 路 径 ， 表 明 希 望 打 开 文 件 ， 并 返 
回 一 个 文件 对 象 。 其 语法 格式 如 下 : 
fileobj=open (filename[,mode[,buffering]]) 


其 中 ，fileobj 是 open0) 函 数 返 回 的 文件 对 象 。 参数 filename (文件 名 ) 是 必 写 参数 ， 它 既 可 
以 是 绝对 路 径 ， 也 可 以 是 相对 路 径 。 模 式 (mode) 和 缓冲 〈buffering) 为 可 选项 。mode 
是 指明 文件 类 型 和 操作 的 字符 串 ， 可 以 使 用 的 值 如 表 1-12 所 示 。 


表 1-12 open() 函 数 中 mode 要 的 党 用 信 























读 模式 ， 如 果 文 件 不 存在 ， 则 发 生 异 常 

写 模式 ， 如 果 文 件 不 存在 ， 则 先 创建 文件 再 打开 ; 如 果 文 件 存在 ， 则 清空 文件 内 容 再 打开 
追加 模式 ， 如 果 文 件 不 存在 ， 则 先 创建 文件 再 打开 ; 如 果 文 件 存在 ， 打 开 文 件 后 将 新 内 容 追 
加 到 原 内 容 之 后 

二 进 制 模式 ， 可 添加 到 其 他 模式 中 使 用 

读 / 写 模式 ， 可 添加 到 其 他 模式 中 使 用 








说 明 : 

(1) 当 mode 参数 省 略 时 ， 可 以 获得 能 读 取 文 件 内 容 的 文件 对 象 ， 即 T' 是 mode 参数 的 
默认 值 。 

(2) 中 参数 指明 读 和 写 都 是 允许 的 ， 可 以 用 到 其 他 任何 模式 中 。 例 如， 可 以 用 'r+' 打 开 
一 个 文本 文件 并 读 / 写 。 

(3) b' 参 数 改 变 处 理 文件 的 方法 。 通 常 ，Python 处 理 的 是 文本 文件 ， 当 处 理 二 进 制 文 
件 〈 例 如 声音 文件 或 图 像 文件 ) 时 应 该 在 模式 参数 中 增加 'b'。 例 如 ， 可 以 用 'tb' 来 读 取 一 个 
二 进 制 文件 。 

openO 函 数 的 第 3 个 参数 一 一 buffering 用 来 控制 缓冲 。 当 该 参数 取 0 或 False 时 ，IO 
是 无 缓冲 的 ， 所 有 读 / 写 操作 直接 针对 硬盘 。 当 该 参数 取 1 或 True 时 ，IO 有 缓冲 ， 此 时 
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Python 使 用 内 存 代替 硬盘 ， 使 程序 的 运行 速度 更 快 ， 只 有 在 使 用 flush0 或 closeO 时 才 会 将 
数据 写 入 硬盘 。 当 参数 大 于 1 时 ， 表 示 缓 冲 区 的 大 小 ， 以 字 节 为 单位 ， 负 数 表示 使 用 默认 
缓冲 区 大 小 。 

下 面 举例 说 明 openO) 函 数 的 使 用 。 

先 用 记事 本 创建 一 个 文本 文件 ， 取 名 为 hello.txt， 然 后 输入 以 下 内 容 ， 保 存在 D 盘 的 
python 文件 夹 中 : 

Hello! 

Henan Zhengzhou 


在 交互 式 环境 中 输入 以 下 代码 : 
>>> helloFile=open("D:\\python\\hello.txt") 


这 条 命令 将 以 读 取 文 本 文件 的 方式 打开 放 在 DD 盘 Python 文 件 夹 下 的 hello.txt 文 件 读 
模式 ”是 Python 打开 文件 的 默认 模式 。 当 文件 以 读 模式 打开 时 ， 只 能 从 文件 中 读 取 数据 ， 
不 能 向 文件 写 入 或 修改 数据 。 

当 调用 open(O) 函 数 时 将 返回 一 个 文件 对 象 , 在 本 例 中 文件 对 象 保存 在 helloFile 变量 中 。 

>>> print (helloFile) 

<_io.TextIOWrapper name='D:\\python\\hello.txt' mode='r' encoding='cp936'> 


在 打印 文件 对 象 时 可 以 看 到 文件 名 、 读 / 写 模式 和 编码 格式 。cp936 是 指 Windows 系统 
中 的 第 936 号 编码 格式 ， 即 GB2312 的 编码 。 接 下 来 就 可 以 调用 helloFile 文件 对 象 的 方法 
读 取 文件 中 的 数据 了 。 


1.5.2 ” 读 取 文 本 文件 


用 户 可 以 调用 文件 对 象 的 多 种 方法 读 取 文 件 内容 。 

@ read0 方 法 

不 设置 参数 的 read() 方 法 将 整个 文件 的 内 容 读 取 为 一 个 字符 串 。read() 方 法 一 次 读 取 文 
件 的 全 部 内 容 , 性 能 根据 文件 大 小 而 变化 , 例如 1GB 的 文件 在 读 取 时 需要 使 用 同样 大 小 的 
内 存 。 

贺 1-29 调用 read() 方 法 读 取 hello.txt 文件 中 的 内 容 。 


helloFile=open("D:\\python\\hello.txt") 
fileContent=helloFile.read() 
helloFile.close() 

print (fileContent) 


输出 结果 : 


Hello! 
Henan Zhengzhou 


用 户 也 可 以 设置 最 大 读 入 字符 数 来 限制 read0 函 数 一 次 返回 的 大 小 。 


























59 | 





| 和 项 目 案例 开发 





从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 

[加 1-30 设置 参数 一 次 读 取 3 个 字符 来 读 取 文件 。 
helloFile=open("D:\\python\\hello.txt") 
fileContent="" 


whileTrue: 


fragment=helloFile.read(3) 


if fragment=—"": # 或 者 if not fragment 
break 
fileContent+=fragment 
helloFile.close() 
print (fileCcontent) 





在 读 到 文件 结尾 之 后 , read() 方 法 会 返回 空 字符 串 ， 此 时 fragment=="" 成 立 ， 
四 readline() 方 法 

readline() 方 法 从 文件 中 获取 一 个 字符 串 ， 每 个 字符 串 就 是 文件 中 的 每 一 行 。 
[ 贺 1-31 调用 readline0 方 法 读 取 hello.txt 文件 中 的 内 容 。 











helloFile=open("D:\\python\\hello.txt") 
fileContent="" 
whileTrue: 
line=helloFile.readline() 
if line=="": # 或 者 if not line 
break 
fileContent+=line 
helloFile.close() 
print (fileContent) 


当 读 取 到 文件 结尾 之 后 ，readline0 方 法 同样 返回 空 字 符 串 ， 使 得 line 一 "成 立 ， 跳 出 


循环 。 


1.5.3” 写 文本 文件 
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@ readlines0 方 法 
Teadlines() 方 法 返回 一 个 字符 串 列 表 ， 其 中 的 每 一 项 是 文件 中 每 一 行 的 字符 
[ 贺 1-32 使 用 readlines0) 方 法 读 取 文件 内 容 。 


helloFile=open("D:\\python\\hello.txt") 

fileContent=helloFile.readlines () 

helloFile.close() 

print (fileContent) 

for line in fileContent:  # 输 出 列表 
print (line) 


readlines() 方 法 也 可 以 设置 参数 ， 指 定 一 次 读 取 的 字符 数 。 




















写 文件 和 读 文件 相似 ， 都 需要 先 创建 文件 对 象 连接 ， 所 不 同 的 是 ， 打 


退出 循环 。 


串 。 





视频 讲解 
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开 文 件 时 是 以 写 模式 或 添加 模式 打开 。 如 果 文 件 不 存在 ， 则 创建 该 文件 。 
与 读 文件 时 不 能 添加 或 修改 数据 类 似 ， 写 文件 时 也 不 允许 读 取 数 据 。 在 用 写 模式 打开 
已 有 文件 时 会 覆盖 文件 的 原 有 内 容 ， 从 头 开始 ， 就 像 用 一 个 新 值 履 写 一 个 变量 的 值 。 


>>> helloFile=open ("D:\\python\\hello.txt", "w") 
# 用 写 模式 打开 已 有 文件 时 会 覆盖 文件 的 原 有 内 容 
>>> fileContent=helloFile.read() 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 

fileContent=helloFile.read() 

IOError: File not open for reading 

>>> helloFile.close() 

>>> helloFile=open("D:\\python\N\hello.txt") 

>>> fileCcontent=helloFile.read() 

>>> len (fileContent) 

0 

>>> helloFile.close() 


于 用 写 模式 打开 已 有 文件 时 文件 的 原 有 内 容 被 清空 , 所 以 再 次 读 取 内 容 时 长 度 为 0。 
@ write() 方 法 

write() 方 法 用 于 将 字符 串 参数 写 入 文件 。 

[加 1-33 用 write() 方 法 写 文件 。 
helloFile=open("D:\\python\\hello.txt","w") 
helloFile.write("First line.\nSsecond line.\n") 
helloFile.close() 
helloFile=open("D:\\PYython\\hello.txt","a") 
helloFile.write("third line. ") 
helloFile.close() 
helloFile=open("D:\\python\\hello.txt") 
fileContent=helloFile.read() 

helloFile.close() 

print (fileContent) 


运行 结果 : 

First line. 

Second line. 

third line. 

当 以 写 模式 打开 文件 hello.txt 时 ， 文 件 的 原 有 内 容 被 覆盖 。 调 用 write() 方 法 将 字符 串 
参数 写 入 文件 ， 这 里 “\n” 代 表 换 行 符 。 关 闭 文件 之 后 再 次 以 添加 模式 打开 文件 hello.txt， 
调用 write( 方 法 写 入 的 字符 串 “third line.” 被 添加 到 了 文件 末尾 。 最 终 以 读 模式 打开 文件 
后 读 取 到 的 内 容 共 有 3 行 字符 串 。 

注意 ，write0 方 法 不 能 自动 在 字符 串 末 尾 添加 换行 符 ， 需 要 用 户 自己 添加 “\n”。 

[ 贺 1-34 完成 一 个 自 定义 函数 copy file0， 实 现 文件 的 复制 功能 。 

copy file0) 函 数 需 要 两 个 参数 ， 指 定 需要 复制 的 文件 oldfile 和 文件 的 备份 newfile。 分 
别 以 读 模 式 和 写 模 式 打开 两 个 文件 ， 从 oldfile 一 次 读 入 50 个 字符 并 写 入 newfile。 当 读 到 
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| pe 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
文件 末尾 时 fleContent 一 "成 立 ， 退 出 循环 并 关闭 两 个 文件 。 
def copy file(oldfile,newfile) : 
oldFile=open(oldfile,"r") 
newFile=open (newfile, "w") 
whileTrue: 
fileContent=oldFile.read(50) 
if fileContent=="": 捍 读 到 文件 末尾 时 
break 
newFile.write (fileContent) 
oldFile.close() 
newFile.close() 
return 
copy_file("D:\\python\\hello.txt","D:\\python\\hello2.txt") 


四 writelines0 方 法 

writelines(sequence) 方 法 向 文件 写 入 一 个 序列 字符 串 列表 , 如 果 需 要 换行 则 要 自己 加 入 
每 行 的 换行 符 。 

obj=open ("log.txt", "w") 

lst2=T"1 tost" "hellor “Ad | 

Obj .writelines (list2) 

obj .close () 

运行 结果 是 生成 一 个 "log.txt" 文 件 ， 内 容 是 “1ltesthello4455”， 可 见 没 有 换行 。 另 外 注 
意 writelines() 方 法 写 入 的 序列 必须 是 字符 串 序 列 ， 整 数 序列 会 产生 错误 。 


1.5.4 文件 内 移动 
回 


无 论 是 读 或 写 文件 ,Python 都 会 跟踪 文件 中 的 读 / 写 位 置 。 在 默认 情况 
下 ， 文 件 的 读 / 写 都 是 从 文件 的 开始 位 置 进行 。Python 提供 了 控制 文件 读 / 视频 讲解 
写 起 始 位 置 的 方法 ， 使 得 用 户 可 以 改变 文件 读 / 写 操作 发 生 的 位 置 。 

当 使 用 open0) 函 数 打开 文件 时 , open0 函 数 在 内 存 中 创建 缓冲 区 , 将 磁盘 上 的 文件 内 容 
复制 到 缓冲 区 。 在 文件 内 容 复制 到 文件 对 象 缓冲 区 后 ， 文 件 对 象 将 缓冲 区 视 为 一 个 大 的 列 
表 ， 其 中 的 每 一 个 元 素 都 有 自己 的 索引 ， 文 件 对 象 按 字 节 对 缓冲 区 索引 计数 。 同 时 ， 文 件 
对 象 对 文件 当前 位 置 〈 即 当前 读 / 写 操作 发 生 的 位 置 ) 进行 维护 ， 如 图 1-23 所 示 。 许 多 方 
法 隐 式 使 用 当前 位 置 。 例 如 在 调用 readline0) 方 法 后 ， 文 件 当前 位 置 移动 到 下 一 个 回 车 处 。 


后 
所 四 

















文件 缓冲 区 
Wi -人 结束 
文件 当前 位 置 


图 1-23 文件 当前 位 置 





第 1 章 Python 基础 知识 01 


Python 使 用 一 些 函 数 跟踪 文件 当前 位 置 。tell0 函 数 可 以 计算 文件 当前 位 置 和 开始 位 置 
之 间 的 字 节 偏 移 量 。 

>>> exampleFile=open ("D:\\python\\example.txt", "w") 

>>> exampleFile.write("0123456789") 

>>> exampleFile.close() 

>>> exampleFile=open ("D:\\python\\example.txt") 

>>> exampleFile.read(2) 

"01， 

>>> exampleFile.read(2) 

123， 

>>> exampleFile.tell() 

4 

>>> exampleFile.close() 

这 里 ，exampleFile.tell0 函 数 返回 的 是 一 个 整数 4， 表 示 文 件 当前 位 置 和 开始 位 置 之 间 
有 4 个 字 节 偏 移 量 。 因 为 已 经 从 文件 中 读 取 4 个 字符 了 ， 所 以 为 4 个 字 节 偏 移 量 。 

seek(O 函 数 设置 新 的 文件 当前 位 置 ， 允 许 在 文件 中 跳 转 ， 实 现 对 文件 的 随机 访问 。 

seek0 函 数 有 两 个 参数 ， 第 1 个 参数 是 字 节 数 ， 第 2 个 参数 是 引用 点 。seek0 函 数 将 广 
件 当前 指针 由 引用 点 移动 指定 的 字 节 数 到 指定 的 位 置 。 其 语法 格式 如 下 : 


seek (offset[,whence]) 


说 明 : offset 是 一 个 字 节 数 ， 表 示 偏 移 量 ， 引 用 点 whence 有 下 面 3 个 取 值 。 

。 文件 开始 处 为 0， 这 也 是 默认 取 值 ， 意 味 着 使 用 该 文件 的 开始 处 作为 基准 位 置 ， 此 
时 字 节 偏 移 量 必 须 非 负 。 

。 当前 文件 位 置 为 1， 则 是 使 用 当前 位 置 作为 基准 位 置 ， 此 时 偏 移 量 可 以 取 负 值 。 

。 文件 结尾 处 为 2， 则 该 文件 的 末尾 将 被 作为 基准 位 置 。 


1.5.5 文件 的 关闭 


用 户 应 该 牢记 使 用 close() 方 法 关闭 文件 .关闭 文件 是 取消 程序 和 文件 之 间 连 接 的 过 程 ， 
内 存 缓冲 区 中 的 所 有 内 容 将 写 入 磁盘 ,因此 必须 在 使 用 文件 后 关闭 文件 确保 信息 不 会 丢失 。 
如 果 要 确保 文件 关闭 ， 可 以 使 用 try/finally 语句 ， 在 finally 子 句 中 调用 close0 方 法 : 


helloFile=open("D:\\python\\hello.txt","w") 
EW 

helloFile.write ("Hello, Sunny Day!") 
finally: 

helloFile.close() 


也 可 以 使 用 with 语句 自动 关闭 文件 : 


with open("D:\\python\\hello.txt") as helloFile: 
s=helloFile.read() 
print (s) 
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| pa 项 目 案例 开发 





语句 
1.5.6” 二进制 文件 的 读 / 写 


Python 没有 二 进 制 类 型 ， 但 是 可 以 用 string (字符 串 ) 类 型 来 存储 二 进 制 类 型 数 


因为 


是 十 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


with 语句 可 以 打开 文件 并 赋值 给 文件 对 象 ， 之 后 就 可 以 对 文件 进行 操作 了 。 文 件 会 在 
结束 后 自动 关闭 ， 即 使 是 由 于 异常 引起 的 结束 也 是 如 此 。 





string 是 以 字 节 为 单位 的 。 

@ 数据 转换 成 字 节 串 

pack() 方 法 可 以 把 数据 转换 成 字 节 串 〈 以 字 节 为 单位 的 字符 串 )。 
格式 如 下 : 

pack (格式 化 字符 串 ， 数 据 ) 

格式 化 字符 串 中 可 用 的 格式 字符 见 表 1-13 中 的 格式 字符 。 例 如 : 
import struct 

a=20 

bytes=struct.pack('i',a) # 将 a 变 为 字符 串 

print (bytes) 

结果 如 下 : 

b'\x14\x00\x00\x00' 

此 时 bytes 就 是 一 个 字符 串 , 该 字符 串 按 字 节 和 a 的 二 进 制 存 储 内 容 相同 。 在 结果 中 x 
六 进 制 的 意思 ，20 的 十 六 进 制 是 14。 

如 果 是 由 多 个 数据 构成 的 ， 可 以 这 样 : 

aa= vec 

b="worldl! 

c=2 

d=45.123 
bytes=struct.pack('5s6sif',a.encode('utf-8'),b.encode('utf-8'),c,d) 


'Ss6sif 就 是 格式 化 字符 串 ， 由 数字 加 字符 构成 。 其 中 ，5Ss 表示 占 5 个 字符 宽度 的 字符 









ve st 


视频 讲解 























串 ，2i 表示 两 个 整数 。 表 1-13 是 可 用 的 格式 字符 及 对 应 C 语言 、Python 语言 中 的 类 型 。 
表 1-13 ”格式 字符 
格式 字符 C 语言 中 的 类 型 了 Python 语言 中 的 类 型 字 节 数 
c char string of length 1 1 
b signed char integer 1 
B unsigned char integer 站 
和 _Bool bool 让 
h short integer 2 
H unsigned short integer 坟 
1 int integer 4 
I unsigned int integer or long 4 
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续 表 

格式 字符 C 语言 中 的 类 型 了 Python 语言 中 的 类 型 字 节 数 

1 long integer 4 

L unsigned long long 4 

q long long long 8 

Q unsigned long long long 8 

¥E float float 4 

d double float 8 

S char[] string 

p char[] string 1 

P Void* long 与 OS 有 关 











bytes=struct.pack('5s6sif',a.encode('utf-8'),b.encode ('utf-8'),c,d) 
此 时 的 bytes 就 是 二 进 制 形式 的 数据 了 ， 可 以 直接 写 入 文件 。 例 如 : 


binfile=open ("D:\\python\\hellobin.txt", "wb") 
binfile.write (bytes) 
binfile.close() 


@ 字 节 串 还 原 成 数据 
unpack() 方 法 可 以 把 相应 数据 的 字 节 串 〈 以 字 节 为 单位 的 字符 串 ) 还 原 成 数据 。 
bytes=struct.pack('i'y20) # 将 20 变 为 字符 串 


再 进行 反 操作 ， 现 有 二 进 制 数据 bytes〈 其 实 就 是 字符 串 )， 将 它 反 过 来 转换 成 Python 


的 数据 类 型 : 


a,=struct.unpack('i',bytes) 
注意 ，unpack0 返 回 的 是 元 组 。 所 以 ， 如 果 只 有 一 个 变量 : 


bytes=struct .pack('i',a) 


那么 解码 的 时 候 需 要 这 样 : 


ay=struct.unpack('i',bytes) 或 者 (a,)=struct.unpack('i',bytes) 


如 果 直 接 用 a=struct.unpack(i',bytes)， 那 么 a=(20,)， 是 一 个 tuple 而 不 是 原来 的 整数 。 
例如 把 D 盘 python 文件 夹 下 hellobin.txt 文件 中 的 数据 读 取 并 显示 。 


import struct 
binfile=open ("D:\\python\\hellobin.txt", "rb") 
bytes=binfile.read() 
(avb,cvd)=struct.unpack('5s6sif',bytes) 

# 通 过 struct .unpack () 解码 成 Python 变量 
t=struct .unpack('5s6sif',bytes) 

# 通 过 struct .unpack () 解码 成 元 组 
print (t) 
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| Be 项 目 案 


从 入 门 到 实战 一 胞 虫 、 游 戏 和 机 器 学 习 
读 取 结 果 : 


(b"hel1lo"， b"worldq!7 7 2, 45.12300109863281) 


1.6 Python 的 第 三 方 库 


Python 语言 有 标准 库 和 第 三 方 库 两 类 库 , 标准 库 随 Python 安装 包 一 起 发 布 , 用 户 可 以 
随时 使 用 ， 第 三 方 库 需 要 在 安装 后 才能 使 用 。 由 于 Python 语言 经 历 了 数 次 版 本 更 迭 ,而 且 
第 三 方 库 由 全 球 开发 者 分 布 式 维护 ,缺少 统一 的 集中 管理 ， 所 以 Python 第 三 方 库 曾 经 一 度 
制约 了 Python 语言 的 普及 和 发 展 。 随 着 官方 pip 工具 的 应 用 ，Python 第 三 方 库 的 安装 变 得 
十 分 容易 。 常 用 Python 第 三 方 库 如 表 1-14。 


表 1-14 常用 Python 第 三 方 库 









































库 名 称 库 用 途 
Django 开源 Web 开发 框架 ， 它 鼓励 快速 开发 ， 并 遵循 MVC 设计 ， 比 较 好 用 ， 开 发 周期 短 
webpy 一 个 小 巧 灵活 的 Web 框架 ， 虽 然 简 单 ， 但 是 功能 强大 
Matplotlib 用 Python 实现 的 类 matlab 的 第 三 方 库 ， 用 于 绘制 一 些 高 质量 的 数学 二 维 图 形 
SciPy 基于 Python 的 matlab 实现 ， 旨 在 实现 matlab 的 所 有 功能 
NumPy 基于 Python 的 科学 计算 第 三 方 库 ， 提 供 了 和 矩阵、 线性 代数 、 传 立 叶 变 换 等 解决 方案 
PyGtk 基于 Python 的 GUI 程序 开发 GTK+ 库 
PyQt 用 于 Python 的 QT 开发 库 


WxPython Python 下 的 GUI 编程 框架 ， 与 MFC 的 架构 相似 
BeautifulSoup | 基于 Python 的 HTML/XML 解析 器 ， 简 单 易 用 








PIL 基于 Python 的 图 像 处 理 库 ， 功 能 强大 ， 对 图 形 文件 的 格式 支持 广泛 
MySQLdb 用 于 连接 MySQL 数据 库 

Pygame 基于 Python 的 多 媒体 开发 和 游戏 软件 开发 模块 

Py2exe 将 Python 脚本 转换 为 Windows 上 可 以 独立 运行 的 可 执行 程序 

pefile Windows PE 文件 解析 器 


最 常用 且 最 高 效 的 Python 第 三 方 库 的 安装 方式 是 采用 pip 工具 安装 。pip 是 Python 官 
方 提供 并 维护 的 在 线 第 三 方 库 安 装 工具 。 对 于 同时 安装 Python2 和 Python3 环境 为 系统 的 
情况 ， 建 议 采用 pip3 命令 专门 为 Python3 版 安装 第 三 方 库 。 

例如 安装 Pygame 库 ，pip 工具 默认 从 网 络 上 下 载 Pygame 库 安 装 文件 并 自动 装 到 系统 
中 。 注 意 ，pip 是 在 命令 行 下 〈cmd) 运行 的 工具 。 

D:\>pip install pygame 

用 户 也 可 以 卸载 Pygame 库 ， 凶 载 过 程 可 能 需要 用 户 确认 。 

D:\>pip uninstall pygame 

用 户 还 可 以 通过 list 子 命令 列 出 当前 系统 中 已 经 安装 的 第 三 方 库 ， 例 如 : 

D:\>pip list 

pip 是 Python 第 三 方 库 最 主要 的 安装 方式 , 可 以 安装 超过 90% 以 上 的 第 三 方 库 。 然而 ， 


由 于 一 些 历 史 、 技 术 等 原因 ， 还 有 一 些 第 三 方 库 暂 时 无 法 用 pip 安装 ， 此 时 需要 用 其 他 的 
安装 方法 例如 下 载 库 文件 后 手工 安装 )。 
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2.1 ” 猜 单 词 游戏 功能 介绍 


猜 单词 游戏 就 是 计算 机 随机 产生 一 个 单词 ， 打 乱 字 母 顺序 ， 供 玩家 去 “尖端 效 拘 ， 
猜 。 此 游戏 采用 控制 字符 界面 ， 运 行 界 面 如 图 2-1 所 示 。 


迎 参加 猜 单词 
6 芝 尖 全 各 灶 半 识 兴 斑 sg 
乱 序 后 单词 : luebjm 


请 你 猜 ; jumble 
a y 


单词 : oionispt 
pe 
后 单词: totnoi op 
请 你 猜 : 








图 2-1 猜 单词 游戏 程序 的 运行 界面 


2.2 程序 设计 的 思路 


在 游戏 中 需要 随机 产生 单词 以 及 数字 ， 所 以 引入 random 模块 随机 数 函数 ， 其 中 
random.choice() 可 以 从 序列 中 随机 选取 元 素 。 例 如 : 


坦 创 建 单词 序列 元 组 
WORDS= ("python"， "jumble", "easy", "difficult", "answer", "continue", 
"phone", "position", "position", "game") 








| 站 本 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


井 从 序列 中 随机 挑 出 一 个 单词 


word=random.choice (WORDS) 


word 就 是 从 单词 序列 中 随机 挑 出 一 个 单词 。 





在 游戏 中 随机 挑 出 一 个 单词 word 后 ， 如 何 把 单词 word 的 字母 顺序 打 乱 ? 方法 是 随机 
从 单词 字符 串 中 选择 一 个 位 置 position, 把 position 位 置 的 那个 字母 加 入 乱 序 后 单词 jumble， 


同时 将 原单 词 word 中 position 位 置 的 那个 字母 删 去 〈 通 过 连接 position 位 置 前 字符 串 和 其 


后 字符 串 实现 )。 通 过 多 次 循环 就 可 以 产生 新 的 乱 序 后 单词 jumble。 


while word: #word 不 是 空 串 循环 
# 根 据 word 长 度 产生 word 的 随机 位 置 
position=random.randrange (len (word)) 
# 将 position 位 置 的 字母 组 合 到 乱 序 后 单词 
jumble+=word [position] 
# 通 过 切片 ， 将 position 位 置 的 字母 从 原单 词 中 删除 
word=word[:position]+word[ (position+1):] 
print (" 乱 序 后 单词 :"，jumble) 


2.3 ”关键 技术 一 一 random 模块 








random 模块 可 以 产生 一 个 随机 数 或 者 从 序列 中 获取 一 个 随机 元 素 , 它 的 常 上 


用 例子 如 下 : 
@ 常用 方法 
1) random random() 
random.random() 用 于 生成 一 个 随机 小 数 n，0<n<1.0。 


import random 
random.random() 


执行 以 上 代码 的 输出 结果 如 下 : 
0.85415370477785668 


2) random.uniform(a, b) 




















方法 和 使 


random.uniform(a, b)， 用 于 生成 一 个 指定 范围 内 的 随机 小 数 ， 两 个 参数 中 一 个 是 上 限 ， 


一 个 是 下 限 。 如 果 a<b， 则 生成 的 随机 数 n 有 a<n<b; 如 果 a>b， 则 b<n<a。 
代码 如 下 : 
import random 


print (random.uniform(10, 20)) 
print (random.uniform(20, 10)) 


执行 以 上 代码 的 输出 结果 如 下 : 


14.247256006293084 
15.53810495673216 
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3) random randint(a.b) 
random randint(a.b) 用 于 随机 生成 一 个 指定 范围 内 的 整数 ， 其 中 参数 a 是 下 限 ， 参 数 b 
是 上 限 ， 生 成 的 随机 数 n 有 a<n<b。 


import random 

print (random.randint (12，20)) 生成 的 随机 数 n 有 12<n<20 
print (random.randint (20，20)) # 结 果 永 远 是 20 

#print (random.randint (20，10) ) # 该 语句 是 错误 的 ， 下 限 必须 小 于 上 限 





4) Iandom.randrange([start],stop[.step]) 

random.randrange([start],stop[,step]) 用 于 从 指定 范围 内 按 指 定 基数 递增 的 集合 中 获取 一 
个 随机 数 。 例 如 random.randrange(10,100,2)， 结 果 相 当 于 从 [10,12,14,16,…,96.98] 序 列 中 获 
取 一 个 随机 数 。random.randrange(10,100,2) 在 结果 上 与 random.choice(range(10,100,2)) 
等 效 。 

5) random.choice() 

random.choice() 从 序列 中 获取 一 个 随机 元 素 ， 其 原型 为 random.choice(sequence)， 参 数 
sequence 表示 一 个 有 序 类 型 。 这 里 要 说 明 一 下 , sequence 在 Python 中 不 是 一 种 特定 的 类 型 ， 
而 是 泛 指 序列 数据 结构 。 列表、 元 组 、 字 符 串 都 属于 sequence。 下 面 是 使 用 random.choice() 
的 一 些 例子 : 


import random 








print (random.choice ("学 习 Python")) # 从 字符 串 中 随机 取 一 个 字符 
print (random.choice(["JGood", "is", "a", "handsome", "boy"])) 

# 从 1ist 列表 中 随机 取 
print (random.choice( ("Tuple", "List", "Dict"))) # 从 tuple 元 组 中 随机 取 
执行 以 上 代码 的 输出 结果 如 下 : 
学 
13 
Dict 


当然 ， 每 次 运行 的 结果 都 不 一 样 。 
6) random.shuffle(x[.random]) 


random.shuffle(x[, random]) 用 于 将 一 个 列表 中 的 元 素 打 乱 ， 例 如 : 


p=["Python", "is", "powerful", "simple", "and so on..."] 














random.shuffle (p) 
print (p) 


执行 以 上 代码 的 输出 结果 如 下 : 
powverful, “simpler "1s", "pythons “and so onss "| 
在 发 牌 游戏 案例 中 使 用 此 方法 打 乱 牌 的 顺序 实现 洗 牌 功能 。 


7) random.sample(sequence, k) 


random.sample(sequence, k) 用 于 从 指定 序列 中 随机 获取 指定 长 度 的 片段 ，sampleO 函 数 
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| ee 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


不 会 修改 原 有 序列 。 


TS Tl 


slice=random.sample (list, 5) # 从 1ist 中 随机 获取 5 个 元 素 作为 一 个 片段 返 


print (slice) 


print (list) # 原 有 序列 并 没有 改变 


执行 以 上 代码 的 输出 结果 如 下 : 

Lo 2 ad gr 7 
J lo)|| 
@ 使 用 举例 

以 下 是 常用 情况 举例 : 

1) 随机 字符 


>>> import random 
>>> random.choice('abcdefg&#%^*f") 


2) 在 多 个 字符 中 选取 特定 数量 的 字符 


>>> import random 
>>>random.sample('abcdefghij', 3) 


其 结果 为 ['a', 'd', 'b']。 
3) 在 多 个 字符 中 选取 特定 数量 的 字符 组 成 新 字符 


>>> import random 


nt 





S30 ln (rndon ml A de ee 


Sy) reoplaceo(® ey 


其 结果 为 'ajh'。 
4) 随机 选取 字符 串 


>>> import random 
>>> random.choice(['apple', 'pear', 'peach', 


其 结果 为 lemon'。 

5) 洗 牌 

>>> import random 

>>> items=[1, 2, 3, 4, 5, 6] 
>>> random.shuffle (items) 
>>> items 


其 结果 为 [3,2,5,6,4,1]。 
6) 随机 选取 0 到 100 之 间 的 偶数 


>>> import random 
>>> random.randrange (0, 101, 2) 


"orange'y 


"Lemon']) 








加 
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其 结果 为 42。 
7) 随机 生成 1 一 100 之 间 的 小 数 


>>> random.uniform(1, 100) 


其 结果 为 5.4221167969800881。 

















2.4 程序 设计 的 步骤 





猜 单词 游戏 程序 的 代码 如 下 : 
# 猜 单词 游戏 


import random 
# 创 建 单词 序列 


WORDS= ("python", "jumble", "easy", "difficult", "answer", "continue", 





"phone", "position", "pose", "game") 
# 开 始 游戏 
print( 
欢迎 参加 猜 单 词 游 戏 
把 字母 组 合成 一 个 正确 的 单词 . 
) 
iscontinue="y" 
while iscontinue=="y" or iscontinue=="Y": 
# 从 序列 中 随机 挑 出 一 个 单词 
word=random.choice (WORDS) 
# 一 个 用 于 判断 玩家 是 否 猜 对 的 变量 


correct=word 


# 创 建 乱 序 后 单词 

jumble="" 

while word: #word 不 是 空 串 循环 
# 根 据 word 长 度 产 生 word 的 随机 位 置 


position=random.randrange (len (word)) 

# 将 position 位 置 的 字母 组 合 到 乱 序 后 单词 

jumble+=word [position] 

# 通 过 切片 将 position 位 置 的 字母 从 原单 词 中 删除 

word=word[:position]+word[ (position+1):] 
print (" 乱 序 后 单词 :"，jumble) 


guess=input ("\n 请 你 猜 : ") 

while guess!=correct and guess!="": 
print ("对 不 起 不 正确 .") 
guess=input ("继续 猜 : ") 


71 | 





| 项 目 案例 开 发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


if guess==correct: 


print (" 真 棒 ， 你 猜 对 了 !") 


iscontinue=input ("\n 是 否 继续 (Y/N): 


运行 结果 : 

欢迎 参加 猜 单 词 游戏 
把 字母 组 合成 一 个 正确 的 单词 - 

乱 序 后 单词 : yaes 

请 你 猜 : easy 

真 棒 ， 你 猜 对 了 ! 

是 否 继续 (Y/N): Y 

乱 序 后 单词 : diufct1fi 

请 你 猜 : difficut1 

对 不 起 不 正确 . 

继续 猜 : difficult 

真 棒 ， 你 猜 对 了 ! 

是 否 继续 (Y/N): n 

>>> 


") 





3.1 智力 问答 测试 功能 介绍 


智力 问答 测试 ， 内 容 涉及 历史 、 经 济 、 风 情 、 民 俗 、 地 理 、 人 文 等 古今 中 外 各 方面 的 
知识 ， 让 玩家 在 轻松 娱乐 、 益 智 、 搞 笑 的 同时 不 知 不 觉 地 增长 知识 。 在 答题 过 程 中 对 做 对 、 做 
错 进行 实时 跟踪 ， 测 试 完成 后 能 根据 玩家 的 答题 情况 给 出 成 绩 。 程 序 运行 界面 如 图 3-1 所 示 。 


























图 3-1 智力 问答 测试 程序 的 运行 界面 


3.2 ”程序 设计 的 思路 


程序 使 用 了 一 个 SQLite 试题 库 test2.db， 其 中 每 个 智力 问答 由 题目 、4 个 选项 和 正确 
答案 组 成 (question、Answer A、Answer B、Answer C、Answer D、right Answer)。 在 
测试 前 ， 程 序 从 试题 库 test2.db 读 取 试 题 信 息 ， 存 储 到 values 列表 中 。 在 测试 时 ， 顺 序 从 
values 列表 读 出 题目 显示 在 GUI 界面 中 供用 户 答题 。 在 进行 界面 设计 时 ， 智 力 问 答题 目 是 
标签 控件 ，4 个 选项 是 单 选 按钮 控件 ， 在 “下 一 题 ”按钮 单 击 事件 中 实现 题目 切换 和 对 错 
判断 ， 如 果 正 确 则 得 分 score 加 10 分 ， 错 误 不 加 分 ， 并 判断 用 户 是 否 做 完 。 在 “结果 ” 按 
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钮 单 击 事件 中 实现 得 分 score 的 显示 。 


3.3 ”关键 技术 


从 Python2.5 版 本 以 上 就 内 置 了 SQLite3, 所 以 在 Python 中 使 用 SQLite 
不 需要 安装 任何 东西 ， 直 接 使 用 。SQLite3 数据 库 使 用 SQL 语言 。SQLite 
作为 后 端 数据 库 ， 可 以 制作 有 数据 存储 需求 的 工具 。Python 标准 库 中 的 
SQLite3 提供 该 数据 库 的 接 


3.3.1 访问 数据 库 的 步骤 


从 Python2.5 开始 ，SQLite3 就 成 了 Python 的 标准 模块 ， 这 也 是 Python 中 的 唯一 一 个 
数据 库 接口 类 模块 ， 大 大 方便 了 用 户 使 用 Python SQLite 数据 库 开 发 小 型 数据 库 应 用 系统 。 

Python 的 数据 库 模 块 有 统一 的 接口 标准 ， 所 以 数据 库 操 作 有 统一 的 模式 ， 操 作 数 据 库 
SQLite3 主要 分 为 以 下 几 步 : 

@ 导入 Python SQLite 数据 库 模 块 

Python 标准 库 中 带 有 sqlite3 模块 ， 可 直接 导入 : 


import sqlite3 


四 建立 数据 库 连 接 ， 返 回 Connection 对 象 
使 用 数据 库 模块 的 connect() 函 数 建立 数据 库 连 接 ， 返 回 连接 对 象 con。 
con=sqlite3.connect (connectstring) # 连 接 到 数据 库 ， 返 回 sqlite3.connection 对 象 
说 明 : connectstring 是 连接 字符 串 。 对 于 不 同 的 数据 库 连 接 对 象 ， 其 连接 字符 串 的 格 
式 不 同 ，sqlite 的 连接 字符 串 为 数据 库 的 文件 名 ， 例 如“E:\test.db”。 如 果 指 定 连接 字符 串 
为 memory， 则 可 创建 一 个 内 存 数据 库 。 例 如 : 
import sqlite3 
con=sqlite3.connect ("E:\\test.db") 
如 果 王 盘 下 的 testdb 存在 , 则 打开 数据 库 ; 否则 在 该 路 径 下 创建 数据 库 test.db 并 打开 。 
全 创建 游标 对 象 
使 用 游标 对 象 能 够 灵活 地 对 从 表 中 检索 出 的 数据 进行 操作 ， 就 本 质 而 言 ， 游 标 实际 上 
是 一 种 能 从 包括 多 条 数据 记录 的 结果 集中 每 次 提取 一 条 记录 的 机 制 。 
调用 con.cursor() 创 建 游标 对 象 cur: 
cur=con.cursor () # 创 建 游标 对 象 


@ 使 用 Cursor 对 象 的 execute() 方 法 执行 SQL 命令 返回 结果 集 

调用 cur.execute()、cur.executemany()、cur.executescript() 方 法 查询 数据 库 。 
。 cur.execute(sq]): 执行 SQL 语句 。 

。 cur.execute(sql, parameters): 执行 带 参数 的 SQL 语句 。 
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。 curexecutemany(sql, seq_of pqrameters): 根据 参数 执行 多 次 SQL 语句 。 

。 cur.executescript(sql_script): 执行 SQL 脚本 。 

例如 创建 一 个 表 category。 

cur.execute ("create table category(id Primary key, sort, name)") 

此 时 将 创建 一 个 包含 3 个 字段 14、sort 和 name 的 表 category。 下 面向 表 中 插入 记录 : 
cur.execute ("insert into category values (1，1， "computer')") 

在 SQL 语句 字符 串 中 可 以 使 用 占 位 符 “?” 表 示 参数 ， 传 递 的 参数 使 用 元 组 。 例 如 : 
cur.execute ("insert into category values (? , ?,?)", (2, 3, 'literature')) 
人 @ 获取 游标 的 查询 结果 集 

调用 curfetchall0、curfetchone0、curfetchmany0O 返 回 查询 结果 。 

。 curfetchone0: 返回 结果 集 的 下 一 行 (Row 对 象 ); 无 数据 时 返回 None。 

。 curfetchall0: 返回 结果 集 的 剩余 行 (Row 对 象 列 表 )， 无 数据 时 返回 空 List。 

。 cur.fetchmany(): 返回 结果 集 的 多 行 (Row 对 象 列表 )， 无 数据 时 返回 空 List。 
例如 : 


CuUT .execute ("select * from catagory") 


print (cur.fetchall ()) # 提 取 查 询 到 的 数据 
返回 结果 如 下 : 
[pl comnputor ss (20 27 M1Ltorataren)l 


如 果 使 用 curfetchone0， 则 首先 返回 列表 中 的 第 1 项 ， 再 次 使 用 ， 返 回 第 2 项 ， 依 次 
进行 。 
用 户 也 可 以 直接 使 用 循环 输出 结果 ， 例 如 : 


for row in cur.execute("select * from catagory"): 









































可 


print (row[0],row[1]) 


@ 数据 库 的 提交 和 回 深 

根据 数据 库 事 物 隔 离 级 别 的 不 同 ， 可 以 提交 或 回 深 。 
。 con.commit(): 事务 提交 。 

。 con.rollback(): 事务 回 深 。 

@@ 关闭 Cursor 对 象 和 Connection 对 象 

最 后 需要 关闭 打开 的 Cursor 对 象 和 Connection 对 象 。 
。 cur.close(): 关闭 Cursor 对 象 。 

。 con.close(): 关闭 Connection 对 象 。 


3.3.2 ”创建 数据 库 和 表 


贺 3-! 创建 数据 库 sales, 并 在 其 中 创建 表 book, 表 中 包含 3 列 , 即 id、 price 和 name， 
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其 中 id 为 主键 (primary key)。 





# 导 入 Python SQLite 数据 库 模块 

import sqlite3 

# 创 建 SQLite 数据 库 

con=sqlite3.connect ("E:\sales.db") 

# 创 建 表 book， 包 含 3 列 ， 即 id (主键 )、price 和 name 


con.execute ("create table book(id primary key, price, name)") 


说 明 : Connection 对 象 的 execute() 方 法 是 Cursor 对 象 对 应 方法 的 快捷 方式 ， 系 统 会 创 


建 一 个 临时 Cursor 对 象 ， 然 后 调用 对 应 的 方法 ， 并 返回 Cursor 对 象 。 


3.3.3 数据库 的 插入 、 更 新 和 删除 操作 





在 数据 库 表 中 插入 、 更 新 、 删 除 记录 的 一 般 步 又 如 下 : 
(1) 建立 数据 库 连 接 。 
(2) 创建 游标 对 象 cur， 使 用 curexecute(sqD) 执 行 SQL 的 insert、update、delete 等 语句 


完成 数据 库 记 录 的 插入 、 更 新 、 删 除 操作 ， 并 根据 返回 值 判 断 操作 结果 。 


(3) 提交 操作 。 
(4) 关闭 数据 库 。 
加 ]-2 数据 库 表 记 录 的 插入 、 更 新 和 删除 操作 。 


import sqlite3 

books=[ ("021",25, "大 学 计算 机 "), ("022", 30,， "大 学 英语 "), ("023",18, "艺术 欣赏 ")， 
( "024",35，" 高 级 语言 程序 设计 ") ] 

# 打 开 数 据 库 

Con=sqlite3.connect ("E:\sales.db") 

# 创 建 游标 对 象 

Cur=Con.cursor () 

# 插 入 一 行 数据 

Cur.execute ("insert into book (id,price,name) values ('001',33,' 大 学 计算 机 
多 媒体 ') ") 

Cur.execute ("insert into book(id,price,name) values(?,?,?) " , ("002",28, 
"数据 库 基础 ") ) 

# 插 入 多 行 数据 

Cur.executemany ("insert into book (id,price,name) values (?,?,?) ",books) 
# 修 改 一 行 数据 

Cur.execute ("Update book set price=? where name=? ", (25," 大 学 英语 ")) 

# 删 除 一 行 数据 

n=Cur.execute ("delete from book where price=?", (25,)) 

print ("删除 了 ",n.rowcount, " 行 记录 ") 

Con.commit () 

Cur .close () 


Con.close() 
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3.3.4 数据 库 表 的 查询 操作 


查询 数据 库 的 步骤 如 下 : 

(1) 建立 数据 库 连接 。 

(2) 创建 游标 对 象 cur， 使 用 curexecute(sqD) 执 行 SQL 的 select 语句 。 
(3) 循环 输出 结果 。 

import sqlite3 

# 打 开 数 据 库 

Con=sqlite3.connect ("E:\sales.db") 

# 创 建 游标 对 象 

Cur=Con.cursor () 

# 查 询 数据 库 表 


Cur.execute ("select id,price,name from book") 














for row in Cur: 
print (row) 


运行 结果 如 下 : 

("001'，33，' 大 学 计算 机 多 媒体 ') 
('002'，28，' 数 据 库 基础 ') 

(全 023 ET 二 术 欣 黄 臣 
("024'，35,，' 高 级 语言 程序 设计 ') 


3.3.5 ”数据 库 使 用 实例 一 一 学 生 通讯 录 


设计 一 个 学 生 通 讯 录 ， 可 以 添加 、 删 除 、 修 改 里 面 的 信息 。 


import sqlite3 
# 打 开 数 据 库 
def opendb () : 
conn=sqlite3.connect ("E:\mydb .db") 





cur=conn .execute ("create table if not exists tongxinlu(usernum 
integer primary key,username varchar(128), passworld varchar (128) ， 


address varchar(125), telnum Varchar (128) ) ") 
return cur, conn 

# 查 询 全 部 信息 

def showalldb () : 


Print ("------------------- 处 理 后 的 数据 ------------------- 


hel=opendb () 


cur=hel[1] .cursor() 
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cur.execute ("select * from tongxinlun) 
res=cur.fetchall () 
for line in res: 
for h in line: 
print (h), 
print 
cur.close() 


# 输 入 信息 
def into(): 


usernum=input ("请 输入 学 号 : ") 
username1=input ("请 输入 姓名 : ") 
passworld1=input ("请 输入 密码 : ") 
addressl=input ("请 输入 地 址 : ") 
telnuml=input ("请 输入 联系 电话 : ") 


return usernum,usernamel, passworldl, addressl, telnuml 


# 往 数据 库 中 添加 内 容 
def adddb () : 


WIE IG 欢迎 使 用 添加 数据 功能 ---------------- mo 
print (welcome) 

person=into() 

hel=opendb () 

hel[1] .execute ("insert into tongxinlu (usernum,username, passworld, 
address, telnum)values(?,?,?,?,?2)", (person[0], person[1], 
person[2], person[3],person[4])) 

hel[1] .commit () 

nl (D0 共 喜 你 ， 数 据 添加 成 功 ---------------- 由 
Showalldb () 

hel[1] .close() 


# 删 除数 据 库 中 的 内 容 
def deldb(): 


WelCOMe="———————---------- 欢迎 使 用 删除 数据 库 功能 ------------------ ， 
print (welcome) 

delchoice=input ("请 输入 想 要 删除 学 号 : ") 

hel=opendb () # 返 回 游标 conn 

hel [1] .execute ("delete from tongxinlu where Usernum ="+delchoice) 
hel[1] .commit () 


showalldb () 
hel[1].close() 


# 修 改 数 据 库 的 内 容 
def alter(): 


EE 欢迎 使 用 修改 数据 库 功 能 ----------------- " 
print (welcome) 

changechoice=input ("请 输入 想 要 修改 的 学 生 的 学 号 : ") 

hel=opendb () 
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person=into() 
hel[1] .execute ("update tongxinlu set usernum=?,username=?, 
passworld=?,address=?, telnum=? where usernum="+changechoice, 
(person[0], person[1], person[2], person[3],person[4])) 
hel[1] .commit () 
showalldb () 
hel[1] .close() 

# 查 询 数 据 

def searchdb(): 
welcome="----------------- 一 欢迎 使 用 查询 数据 库 功能 ----------------- 五 
print (welcome) 
choice=input ("请 输入 要 查询 的 学 生 的 学 号 : ") 
hel=opendb () 
cur=hel[1] .cursor() 
cur.execute ("select * from tongxinlu where usernum="+choice) 
hel[1] .commit () 


for row in cur: 
print (row[0],row[1],row[2],row[3],row[4]) 
cur.close() 
hel[1] .close() 
# 是 否 继续 
def conti (a): 
choice=input ("是 否 继续 ? (y or n) :") 
if choice=="'y"': 
= 
Se 
a=0 
return a 








if _name 
flag=1 
while flag: 
welcome="--------- 欢迎 使 用 数据 库 通讯 录 --------- " 


print (welcome) 


i 





choiceshow=""" 

请 选择 您 的 进一步 选择 : 

(添加 》 往 数据 库 里 面 添 加 内 容 

(删除 》 删 除数 据 库 中 内 容 

(修改 》 修 改 数据 库 的 内 容 

(查询 ) 查询 数据 库 的 内 容 

选择 您 想 要 进行 的 操作 : 
choice=input (choiceshow) 
if choice==" 添 加 ": 

adddb () 
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conti (flag) 
elif choice==" 删 除 ": 

deldb() 

conti (flag) 
elif choice==" 修 改 ": 

alter() 

conti (flag) 
elif choice==" 查 询 ": 

searchdb () 

conti (flag) 
Sg 


print ("你 输入 错误 ， 请 重新 输入 ") 
程序 运行 界面 和 添加 记录 界面 如 图 3-2 所 示 。 


Python 3.5.2 (v3.5.2.4def2a2901a5, Jun 2 Python 3.5.2 (v3. 65.2 4def2a290135, Jun 25 2016, 22,01 19) TSC 
tel)] on win32 

Type “copyright”, “credits” or “licenset 
>>> 


te1)],on win32 
Type “copyright”, “credits” or “license()” for aore inforaatic 


Ci \Users\think\Desktop\python\li. py 


m= RESTART- 
欢迎 使 用 数据 库 通 讯 录 








和 曾 六 六 满 联 
机 

辽 戎 出 而 秆 
莎 册 丑 卫 谋 





图 3-2 程序 运行 界面 和 添加 记录 界面 





3.4 程序 设计 的 步 又 
3.4.1 生成 试题 库 


import sqlite3 # 导 入 SOLite 驱动 

# 连 接 到 SQLite 数据 库 ， 数 据 库 文 件 是 test .db 

# 如 果 文 件 不 存在 ， 会 自动 在 当前 目录 创建 

conn=sqlite3.connect ('test2.db') 

cursor=conn.cursor() # 创 建 一 个 cursor 

#cursor.execute ("delete from exam") 

# 执 行 一 条 SQL 语句 ， 创 建 exam 表 

cursor.execute('create table [exam] ([question] varchar (80) null, [Answer A] 
varchar(1) null, [Answer B] varchar (1) null, [Answer C] varchar (1) null, 
[Answer D] varchar (1) null, [right Answer] varchar (1) al 

# 继 续 执行 一 条 SQL 语句 ， 插 入 一 条 记录 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer _D，right Answer) values ("' 哈 雷 慧 星 的 平均 周期 为 "'， "54 年 '， "56 年 "'，"73 
EL Sv esl) 


cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 


A 
国 丰 放 坟 
视频 讲解 
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Rnswer _D，right Rnswer) values(" 夜 郎 自 大 中 “ 夜 郎 ” 指 的 是 现在 哪个 地 方 ? '，“" 贵 州 '， 
' 云 南 '，' 广 西 '，' 福 建 '，'A') ") 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Rnswer _D，right _Answer) values(' 在 中 国 历史 上 是 谁 发 明了 麻药 '，' 孙 思 旷 '，' 华 伦 '， 
P31 5 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer D，right Answer) values(' 京 剧 中 花旦 是 指 '，' 年 轻 男 子 '，' 年 轻 女 子 '，' 年 长 男子 '， 
EE 

cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer D，right Answer) values(' 篮 球 比赛 每 队 几 人 ? '，'4',，'5',，'6','7', 'B')") 
cursor.execute ("insert into exam (question, Answer A, Answer B, Answer C, 
Answer_D，right_Answer) values ('" 在 天 原作 比 愤 鸟 ， 在 地 愿 为 连理 枝 。 讲 述 的 是 谁 的 爱情 故事 ? '， 
' 焦 钟 狠 和 刘 兰 芝 ' ，' 梁 山 伯 与 祝 英 台 ' ，' 崔 营 营 和 张 生 ' ，' 杨 贵妃 和 唐 明 皇 '，'D' ) ") 


print (cursor.rowcount) # 通 过 rowcount 获得 插入 的 行 数 
cursor.close() # 关 闭 Cursor 

conn.commit () # 提 交 事务 

conn.close() # 关 闭 Connection 


以 上 代码 完成 数据 库 test2.db 的 建立 。 下 面 实现 智力 问答 测试 程序 功能 。 
3.4.2 ” 读 取 试 题 信息 


conn=sqlite3.connect ('test2.db') 
cursor=conn.cursor() 

# 执 行 查询 语句 

cursor.execute('select * from exam') 
# 获 得 查询 结果 集 

values=cursor.fetchall () 
cursor.close() 

conn.close() 


以 上 代码 完成 数据 库 test2.db 的 试题 信息 的 读 取 ， 存 储 到 values 列表 中 。 


3.4.3 ”界面 和 逻辑 设计 


callNextO 用 于 判断 用 户 选择 的 正 误 ， 正 确 则 加 10 分 ， 错 误 不 加 分 ， 并 判断 用 户 是 否 
做 完 , 如 果 没 做 完 , 则 将 下 一 题 的 题目 信息 显示 到 timu 标签 ,4 个 选项 显示 到 radiol ~radio4 
这 4 个 单 选 按 钮 上 。 

import tkinter 

from tkinter import * 

from tkinter.messagebox import * 

def callNext (): 


global Kk 

global score 

useranswer=r.get () # 获 取 用 户 的 选择 

print (r.get ()) # 获 取 被 选中 单 选 按钮 变量 值 


if useranswer==values[k] [5]: 
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showinfo (" 恭 喜 "， "恭喜 你 对 了 ! ") 


SCore+=10 
else: 

showinfo ("遗憾 ", "遗憾 你 错 了 ! ") 
k=K+1 
if k>=len (values): 

showinfo ("提示 ", "题目 做 完了 ") 

return 
# 显 示 下 一 题 
timu["text"]=values[k] [0] 
radiol["text"]=values[k] [1] 
radio2["text"]=values[k] [2] 
radio3["text"]=values[k] [3] 
radio4["text"]=values[k] [4] 
wgebt Sal 


def callResult (): 
showinfo ("你 的 得 分 "，, str (score)) 


以 下 是 界面 布局 代码 : 


root=tkinter.Tk() 

root .title('Python 智力 问答 游戏 ') 
root .geometry ("500x200") 
IF=tkinter .StringVar () 
r.set('E') 

k=0 

score=0 


# 判 断 用户 是 否 做 完 


# 题 目 信息 
#R 选项 
#B 选项 
#C 选项 
#D 选项 


# 创 建 StringVar 对 象 
# 设 置 初始 值 为 'E'， 初 始 没 选中 


timu=tkinter.Label (root, text=values [k] [0] ) # 题 目 


timu.pack () 
fl=Frame (root) 
fl.pack() 


radiol=tkinter.Radiobutton (f1,variable=r,value='A', text=values [k] [1]) 


radiol .pack() 


radio2=tkinter.Radiobutton (f1,variable=r,value='B', text=values [Kk] [2]) 


radio2.pack() 


radio3=tkinter.Radiobutton (f1,variable=r,value='C', text=values [Kk] [3]) 


radio3.pack() 


radio4=tkinter.Radiobutton (f1,variable=r,value='D', text=values [K] [4]) 


radio4.pack() 
f2=Frame (root) 
f2.pack() 


# 创 建 第 1 个 Frame 组 件 


# 创 建 第 2 个 Frame 组 件 


Button (f2, text=' 下 一 题 ', command=callNext) .pack (side=LEFT) 
Button (£2, text=" 结 果 ' :Command=callResult) .pack (side=LEFT) 


root .mainloop () 





4.1 小 小 翻译 器 功能 介绍 


小 小 翻译 器 使 用 百度 翻译 开放 平台 提供 的 API， 实 现 简单 的 翻译 功能 ， 用 户 输入 自己 
需要 翻译 的 单词 或 者 句子 ， 即 可 得 到 翻译 的 结果 ， 运 行 界面 如 图 4-1 所 示 。 该 翻译 器 不 仅 
能 够 将 英文 翻译 成 中 文 ， 也 可 以 将 中 文 翻译 成 英文 ， 或 者 是 其 他 语言 。 














图 4-1 小 小 翻译 器 的 运行 界面 


4.2 程序 设计 的 思路 


百度 翻译 开放 平台 提供 的 API， 可 以 为 用 户 提供 高 质量 的 翻译 服务 。 通 过 调用 百度 翻 
译 API 编写 在 线 翻译 程序 。 

百度 翻译 开放 平台 每 月 提供 200 万 字符 的 免费 翻译 服务 ， 只 要 拥有 百度 账号 并 申请 成 
为 开发 者 就 可 以 获得 所 需要 的 账号 和 密码 。 下 面 是 开发 者 申请 链接 : 
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http://api.fanyi.baidu.com/api/trans/product/index 

为 方便 使 用 ， 百 度 翻译 开放 平台 提供 了 详细 的 接 入 文档 ， 链 接 如 下 : 

http://api.fanyi.baidu.com/api/trans/product/apidoc 

在 相应 文档 中 列 出 了 详细 的 使 用 方法 。 

按照 百度 翻译 开放 平台 文档 中 的 要 求 ,生成 URL 请 求 网 页 , 提交 后 可 返回 JSON 数据 
格式 的 翻译 结果 ， 再 将 得 到 的 JSON 格式 的 翻译 结果 解析 出 来 。 


4.3 ”关键 技术 











4.3.1 urllib 库 简 介 


urllib 是 Python 标准 库 中 最 常用 的 Python 网 页 访问 的 模块 ， 它 可 以 让 用 户 像 访问 本 地 
文本 文件 一 样 读 取 网 页 的 内 容 。Python2 系列 使 用 的 是 urllib2，Python3 以 后 将 其 全 部 整合 
为 urllib; 在 Python3.x 中 ， 用 户 可 以 使 用 urllib 这 个 库 抓 取 网 页 。 

urllib 库 提 供 了 一 个 网 页 访问 的 简单 易 懂 的 API 接口 ， 还 包括 一 些 函数 方法 ， 用 于 进 
行 参 数 编码 、 下 载 网 页 等 操作 。 这 个 模块 的 使 用 门槛 非常 低 ， 初 学 者 也 可 以 尝试 去 抓 取 和 
读 取 或 者 保存 网 页 。urllib 是 一 个 URL 处 理 包 ， 在 这 个 包 中 集合 了 一 些 处 理 URL 的 模块 。 

(1) urllib.request 模块 : 用 来 打开 和 读 取 URL。 

(2) urllib.error 模块 : 包含 一 些 由 urllib.request 产生 的 错误 ， 可 以 使 用 try 进行 捕捉 
处 理 。 

(3) urllib.parse 模块 : 包含 一 些 解析 URL 的 方法 。 

(4) urllib.robotparser 模块 : 用 来 解析 robots.txt 文本 文件 。 它 提供 了 一 个 单独 的 
RobotFileParser 类 ， 通 过 该 类 提供 的 can_fetch0 方 法 测试 仆 虫 是 否 可 以 下 载 一 个 页 面 。 


4.3.2 urllib 库 的 基本 使 用 


下 面 结合 使 用 urllib.request 和 urllib.parse 两 个 模块 说 明 urllib 库 的 使 用 方法 。 

@ 获取 网 页 信息 

使 用 urllib.request.urlopen0) 函 数 可 以 很 轻松 地 打开 一 个 网 站 ， 读 取 并 打印 网 页 信息 。 
urlopen() 函 数 的 语法 格式 如 下 : 


urlopen(url[, datal[l, proxies]]) 


urlopen() 返 回 一 个 Response 对 象 , 然后 像 本 地 文件 一 样 操作 这 个 Response 对 象 来 获取 
远程 数据 。 其 中 ， 参 数 url 表示 远程 数据 的 路 径 ， 一 般 是 网 址 ; 参数 data 表示 以 post 方式 
提交 到 URL 的 数据 (提交 数据 有 两 种 方式 一 一 post 与 geb 一 般 情况 下 很 少 用 到 这 个 参数 ); 
参数 proxies 用 于 设置 代理 。urlopen0 还 有 一 些 可 选 参数 ， 对 于 具体 信息 ， 读 者 可 以 查阅 
Python 自 带 的 文档 。 
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urlopen0 返 回 的 Response 对 象 提供 了 如 下 方法 。 

。 read()、readline()、readlines()、fileno()、close0: 这 些 方法 的 使 用 方式 和 文件 对 象 完 
全 一 样 。 

。 info0: 返回 一 个 httplib.HTTPMessage 对 象 ， 表 示 远 程 服务 器 返回 的 头 信息 。 

getcode(): 返回 HTTP 状态 码 。 如 果 是 HTTP 请 求 ，200 表示 请 求 成 功 完成 ，404 表 

示 网 址 未 找到 。 

。 geturl(): 返回 请 求 的 URL。 

了 解 了 这 些 ， 读 者 就 可 以 编写 一 个 最 简单 的 候 取 网 页 的 程序 。 

#urllib test01.pY 

from urllib import request 








if _ name ==" main _": 
response=request .urlopen ("http://fanyi.baidu.com") 
html=response.read() 


html=html .decode ("utf-8") #decode () 将 网 页 的 信息 进行 解码 ， 否 则 会 产生 乱码 
Print (html) 


urllib 使 用 requesturlopen0 打 开 和 读 取 URL 信息 , 返回 的 对 象 Response 如 同一 个 文本 
对 象 ， 用 户 可 以 调用 read0 进 行 读 取 ， 再 通过 print0) 将 读 到 的 信息 打印 出 来 。 
运行 py 程序 文件 ， 输 出 信息 如 图 4-2 所 示 。 










low Plashel Debog Opionccaiodowstidp 
== RESTART: D:, oe 1001. py ===: 
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meta charset="utf. 
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图 4-2 读 取 的 百度 翻译 网 页 源码 


其 实 ， 这 就 是 浏览 器 接收 到 的 信息 ， 只 不 过 用 户 在 使 用 浏览 器 的 时 候 ， 浏 览 器 已 经 将 
这 些 信 息 转化 成 了 界面 信息 供用 户 浏览 。 浏 览 器 就 是 作为 客户 端 从 服务 器 端 获 取信 息 ， 然 
后 将 信息 解析 ， 再 展示 给 用 户 的 。 

这 里 通过 decode0 命 令 将 网 页 的 信息 进行 解码 : 


html=htm]l .decode ("utf-8") 


当然 , 这 个 前 提 是 用 户 已 经 知道 了 这 个 网 页 是 使 用 utf-8 编码 的 , 那么 怎么 查看 网 页 的 
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编码 方式 呢 ? 非常 简单 的 方法 是 使 用 浏览 器 查看 网 页 源码 , 只 需要 找到 head 标签 开始 位 置 
的 chareset， 就 能 知道 网 页 是 采用 何 种 编码 了 。 

需要 说 明 的 是 ，urlopen() 函 数 中 的 url 参数 不 仅 可 以 是 一 个 字符 串 ， 例 如 "http:/wwvw- 
baidu.com"， 还 可 以 是 一 个 Request 对 象 ， 这 就 需要 先 定义 一 个 Request 对 象 ， 然 后 将 这 个 
Request 对 象 作为 urlopen() 的 参数 使 用 ， 方 法 如 下 : 


req=request .Request ("http://fanyi.baidu.com/")  #Request 对 象 
response=request .urlopen (req) 

html=response.read() 

html=html .decode ("utf-8") 

print (html) 


注意 : 如 果 要 把 对 应 文件 下 载 到 本 地 ， 可 以 使 用 urlretrieve(O) 函 数 。 


from urllib import request 
request .urlretrieve ("http://www.zzti.edu.cn/ mediafile/index/2017/06/24 
/1qjdyc7ivgq5.jpg","aaa.jpg") 


这 样 就 可 以 把 网 络 上 中 原 工学 院 的 图 片 资源 1qjdyc7vq5.jpg 下 载 到 本 地 ， 生 成 aaajpg 
图 片 文件 。 

@ 获取 服务 器 响应 信息 

和 浏览 器 的 交互 过 程 一 样 ，request'urlopen() 代 表 请 求 过 程 ， 它 返回 的 HTTPResponse 
对 象 代表 响应 ,。 返回 内 容 作 为 一 个 对 象 更 便于 操作 ,HTTPResponse 对 象 的 status 属性 返回 
请 求 HTTP 后 的 状态 ， 在 处 理 数 据 之 前 要 先 判断 状态 情况 。 如 果 请 求 未 被 响应 ， 需 要 终止 
内 容 处 理 。reason 属性 非常 重要 ， 可 以 得 到 未 被 响应 的 原因 ，url 属性 用 于 返回 页 面 URL。 
HTTPResponse.read() 用 于 获取 请 求 的 页 面 内 容 的 二 进 制 形式 。 

用 户 也 可 以 使 用 getheaders() 返 回 HTTP 响应 的 头 信息 ， 例 如 : 


from urllib import request 
f=request .urlopen ('http://fanyi.baidu.com') 
data=f.read() 
print('status:', f.status, f.reason) 
for k, v in f.getheaders(): 
print (us: tou Wk v)) 


可 以 看 到 HTTP 响应 的 头 信息 。 


Status: 200 OK 

Content-Type: text/html 

Date: Sat, 15 Jul 2017 02:18:26 GMT 

P3p: CP=" OTI DSP COR IVA OUR IND COM " 

Server: Apache 

Set-Cookie: locale=zh; expires=Fri, 11-May-2018 02:18:26 GMT; path=/; 
domain=.baidu.com 

Set-Cookie: BAIDUID=2335F4F896262887F5B2BCEAD460F5E9:FG=1; expires=Sun, 
15-Jul-18 02:18:26 GMT; max-age=31536000; path=/; domain=.baidu.com; 
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version=1 
Vary: Accept-Encoding 


Connection: close 


Transfer-Encoding: chunked 


同样 可 以 使 用 Response 对 象 的 geturl0 方 法 、info0 方 法 、getcode0) 方 法 获取 相关 的 URL、 














响应 信息 和 响应 HITP 状态 码 。 


#-*— coding: UTF-8 —*-— 

from urllib import request 

if _ name ==" main _": 
req=request .Request ("http://fanyi.baidu.com/") 
response=request .urlopen (req) 
print ("geturl 打印 信息 : $s"% (response.geturl())) 


PIinNt 七 (' * 闵 玉 闵 六 水 冰冰 水 水 永 闵 六 水 六 闪光 六 水 水 率 六 六 水 认 率 水 六 认 率 率 冰冰 永 永 冰冰 这 冰冰 水 冰冰， ) 


print ("info 打印 信息 : $s"% (response.info())) 
PIKint 七 ("六 六 水 六 六 水 水 水 水 水 水 率 闵 六 水 率 率 六 六 水 水 水 六 六 水 率 六 六 冰冰 率 六 水 水 冰冰 水 冰冰 冰冰 浆 ，) 


print ("getcode 打印 信息 : $s"% (response.getcode())) 
可 以 得 到 如 下 运行 结果 : 


geturl 打印 信息 : http://fanyi.baidu.com/ 

米 米 玉米 闵 米 六 六 六 六 六 六 六 六 米 冰冰 六 六 六 六 六 六 冰冰 米 冰 六 六 六 六 冰冰 六 六 六 冰冰 玉 冰 闵 玉 六 六 六 六 

info 打印 信息 : Content-Type: text/html 

Date: Sat, 15 Jul 2017 02:42:32 GMT 

P3p: CP=" OTI DSP COR IVR OUR IND COM " 

Server: Apache 

Set-Cookie: locale=zh; expires=Fri, 11-May-2018 02:42:32 GMT; path=/; 
domain=.baidu.com 

Set-Cookie: BAIDUID=976A41D6BOC3FD6CA816A09BEAC3A89A:FG=1; expires=Sun, 
15-Jul-18 02:42:32 GMT; max-age=31536000; path=/; domain=.baidu.com; 
Version=1 

Vary: Accept-Encoding 

Connection: close 

Transfer-Encoding: chunked 

米 六 六 六 玉米 六 六 六 六 六 六 六 六 六 六 六 冰 六 米 闵 六 玉 冰冰 六 冰 六 六 六 六 冰冰 冰冰 冰冰 六 冰冰 六 冰冰 六 冰冰 


getcode 打印 信息 : 200 


现在 读者 已 经 学 会 了 使 用 简单 的 语句 对 网 页 进行 抓 取 ， 接 下 来 学 习 如 何 向 服务 器 发 送 


人 @ 向 服务 器 发 送 数据 
用 户 可 以 使 用 urlopen0 函 数 中 的 data 参数 向 服务 器 发 送 数据 。 根 据 HTTP 规范 ，get 























用 了 


F 信息 获取 ，post 是 向 服务 器 提交 数据 的 一 种 请 求 。 换 名 话说， 从 客户 端 向 服务 器 提交 
































数据 使 用 post， 从 服务 器 获得 数据 到 客户 端 使 用 get。get 也 可 以 提交 , 与 post 的 区 别 如 下 : 

















(1) get 方式 可 以 通过 URL 提交 数据 ， 待 提交 数据 是 URL 的 一 部 分 ;采用 post 方式 ， 


待 提交 数据 放置 在 HIML header 内 。 
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(2) get 方式 提交 的 数据 最 多 不 超过 1024 个 字 节 , post 没有 对 提交 内 容 的 长 度 做 限制 。 

如 果 没 有 设置 urlopen(O) 函 数 的 data 参数 ，HTTP 请 求 采用 get 方式 ， 也 就 是 从 服务 器 
获取 信息 ;如果 设 置 data 参数 ，HTTP 请 求 采用 post 方式 ， 也 就 是 向 服务 器 传递 数据 。 

data 参数 有 自己 的 格式 ， 它 是 一 个 基于 application/x-www.form-urlencoded 的 格式 ， 对 
于 其 具体 格式 ， 读 者 不 用 了 解 ， 因 为 可 以 使 用 urllib.parse.urlencode() 函 数 将 字符 串 自 动 转 
换 成 上 面 所 说 的 格式 。 

@ 使 用 User Agent 隐藏 身份 

1) 为 何 要 设置 User Agent 

有 些 网 站 不 喜欢 被 怜 虫 程序 访问 ， 所 以 会 检测 连接 对 象 ， 如 果 是 怜 虫 程序 ， 也 就 是 非 
人 点 击 访问 ， 它 就 会 不 让 继续 访问 ， 所 以 为 了 让 程序 可 以 正常 运行 ， 需 要 隐藏 自己 的 疏 虫 
程序 的 身份 。 此 时 可 以 通过 设置 User Agent 来 达到 隐藏 身份 的 目的 ，User Agent 的 中 文 名 
为 用 户 代理 ， 简 称 UA。 

User Agent 存放 于 headers 中 ， 服 务 器 就 是 通过 查看 headers 中 的 User Agent 来 判断 是 
谁 在 访问 。 在 Python 中 ， 如 果 不 设置 User Agent， 程 序 将 使 用 默认 的 参数 ， 那 么 这 个 User 
Agent 就 会 有 Python 的 字样 ， 如 果 服 务 器 检查 User Agent， 那 么 没有 设置 User Agent 的 
Python 程序 将 无 法 正常 访问 网 站 。 

Python 允许 用 户 修改 这 个 User Agent 来 模拟 浏览 器 访问 ， 它 的 强大 毋庸 置疑 。 

2) 常见 的 User Agent 

(1) Android: 















































*Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 
(KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19 

*Mozilla/5.0 (Linux; U; Android 4.0.4; en-gb; GT-I9300 Build/IMM76D) 
AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30 
*Mozilla/5.0 (Linux; U; Android 2.2; en-gb; GT-P1000 Build/FROYO) 
AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1 


(2) Firefox: 


*Mozilla/5.0 (Windows NT 6.2; WOW64; rv:21.0) Gecko/20100101 Firefox/21.0 
*Mozilla/5.0 (Android; Mobile; rv:14.0) Gecko/14.0 Firefox/14.0 


(3) Google Chrome: 


*Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) 
Chrome/27.0.1453.94 Safari/537.36 

*Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/ 
535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19 


(4) 10S: 


*Mozilla/5.0 (iPad; CPU 0S 5 0 like Mac OS X) AppleWebKit/534.46 (KHTML, like 
Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3 

*Mozilla/5.0 (iPod; U; CPU like Mac OS X7 en) AppleWebKit/420.1 (KHTML, like 
Gecko) Version/3.0 Mobile/3A101a Safari/419.3 
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小 小 翻译 器 


上 面 列举 了 Android、Firefox、Google Chrome、iOS 的 一 些 User Agent。 

3) 设置 User Agent 的 方法 

设置 User Agent 有 以 下 两 种 方法 : 

(1) 在 创建 Request 对 象 的 时 候 填 入 headers 参数 (包含 User Agent 信息 )， 这 个 
headers 参数 要 求 为 字典 。 

(2) 在 创建 Request 对 象 的 时 候 不 添加 headers 参数 ， 在 创建 完成 之 后 使 用 add_ 
header() 方 法 添加 headers。 


使 




















上 面 提 到 的 Android 的 第 1 个 User Agent, 在 创建 Request 对 象 的 时 候 传 入 headers 





参数 ， 编 写 代 码 如 下 : 


#-*- coding: UTF-8 —*-— 


from urllib import request 


if _ 


_name ==" main _": 

# 以 CSDN 为 例 ，CSDN 不 更 改 User Agent 是 无 法 访问 的 
url='http://www.csdn.net/' 

head={} 

# 写 入 User Agent 信息 

head['User-Agent']='Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/ 
JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 
Safari/535.19"' 


req=request .Request (url, headers=head) # 创 建 Request 对 象 
response=request .urlopen (req) # 传 入 创建 好 的 Request 对 象 
html=response.read() .decode ('utf-8') # 读 取 响 应 信息 并 解码 
print (html) # 打 印信 息 

方法 二 : 


使 用 上 面 提 到 的 Android 的 第 1 个 User Agent， 在 创建 Request 对 象 时 不 传 入 headers 
参数 ， 在 创建 之 后 使 用 add_header() 方 法 添加 headers， 编 写 代码 如 下 : 


#-*- coding: UTF-8 —*-— 


from urllib import request 


卫生 


__name ==" main _": 


# 以 CSDN 为 例 ，CSDN 不 更 改 User Agent 是 无 法 访问 的 
url="'http://www.csdn.net/"' 

req=request .Request (url) # 创 建 Request 对 象 

req.add header('User-Agent', 'Mozilla/5.0 (Linux; Android 4.1.1; Nexus 
7 Build/JROO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/ 


LD 025.160 .Sartari/5 50 # 传 入 headers 
response=request .urlopen (req) # 传 入 创建 好 的 Request 对 象 
html=response.read() .decode ('utf-8') # 读 取 响 应 信息 并 解码 

print (html) # 打 印信 息 
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4.4 程序 设计 的 步骤 





4.4.1 设计 筑 面 











采用 Tkinter 的 place 几何 布局 管理 器 设计 GUI 图 形 界 面 ， 








新 建文 件 translate _ 








图 4-3 place 几何 布局 管理 器 


test.py， 编 写 如 下 代码 : 


from tkinter import * 


if _ name ==" 1 


root=TKk () 


再 


root .title ("单词 翻译 器 ") 


root['width']=250;root['height']=130 
Label (root, text=' 输 入 要 翻译 的 内 容 : 


Entryl=Entry 
Entryl.place 


Label (root, text=' 翻译 的 结果 : 


(root, width=20) 
(x=110, y=1) 


S=StringVar () 
s.set ("大 家 好 ， 这 是 测试 ") 


Entry2=Entry (root,width=20, textvariable=s) 


Entry2.place 


Buttonl=Button (root, text=" 翻译 ' ,width=8) 


(x=110, y=20) 


Buttonl .place (x=40, y=80) 


Button2=Button (root, text=' 清 空 ', width=8) 


Button2 .place (x=110, y=80) 
# 给 Button 绑 定 鼠标 监听 事件 


Buttonl .bind("<Button-1>", leftClick) 
Button2.bind("<Button-1>", leftclick2) 


root .mainloop () 


4.4.2 ”使 用 百度 翻译 开放 平台 


使 用 百度 翻译 需要 向 “http://api.fanyi.baidu.com/api/trans/vip/translate ”地 址 通过 post 
bP 的 请 求 参 数 来 访问 服务 。 


或 get 方法 发 送 表 4-1 
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运行 





视频 讲解 


效果 如 图 4-3 所 示 。 


',width=15) .place (x=1, y=1) 
# 绝 对 坐标 (1，1) 


# 绝 对 坐标 (110，1) 
',width=18) .place (x=1, y=20) # 绝 对 坐标 (1，20) 

# 一 个 StringVar () 对 象 

# 绝 对 坐标 (110，20) 

# 绝 对 坐标 (40， 80) 

# 绝 对 坐标 (110， 80) 


#“ 翻 译 ” 按 钮 
#“ 清 空 ”按钮 














第 4 童 调用 百度 API 应 用 一 一 小 小 翻译 器 
表 4-1 请 求 参数 
参 数 名 描 述 和 
q 请 求 翻译 query UTF-8 编码 
from 源 语 襄 语言 列表 (可 设置 为 auto) 
to 语言 列表 (不 可 设置 为 auto) 
appid 可 在 管理 控制 台 查 看 
salt 
sign appid+q+salt+ 密 钥 的 md5 值 

















sign 签名 是 为 了 保证 调用 安全 ， 使 用 mds 算法 生成 的 一 段 字 符 串 ， 生 成 的 签名 长 度 为 
32 位 ， 签 名 中 的 英文 字符 均 为 小 写 格式 。 为 保证 翻译 质量 ， 请 将 单 次 请 求 长 度 控制 在 6000 
字 节 以 内 〈 汉 字 约 为 2000 个 )。 

签名 的 生成 方法 如 下 : 

(1) 将 请 求 参数 中 的 appid、query (q， 注 意 为 UTF-8 编码 )、 随 机 数 salt 以 及 平台 分 
配 的 密 钥 (可 在 管理 控制 台 查 看 ) 按照 appid+q+salt+ 密 钥 的 顺序 拼接 得 到 字符 串 1。 

(2) 对 字符 串 1 做 md5， 得 到 32 位 小 写 的 sign。 


注意 : 

(1) 先 将 需要 翻译 的 文本 转换 为 UTF-8 编码 。 

(2) 在 发 送 HITP 请 求 之 前 需要 对 各 字段 做 URL encode。 

(3 ) 在 生成 签名 拼接 字符 串 时 ，q 不 需要 做 URL encode， 在 生成 签名 之 后 发 送 HITP 
请 求 之 前 才 需 要 对 要 发 送 的 待 翻译 文本 字段 q 做 URL encode。 


例如 将 apple 从 英文 翻译 成 中 文 。 
请 求 参数 : 

q=apple 

from=en 

to=zh 
appid=2015063000000001 
salt=1435660288 
平台 分 配 的 密 钥 : 12345678 


生成 签名 参数 sign: 

(1) 拼接 字符 串 1。 

拼接 appid=2015063000000001+q=apple+salt=1435660288+ 密 钥 =12345678 

得 到 字符 串 1=2015063000000001apple143566028812345678 

(2) 计算 签名 sign〈 对 字符 串 1 做 mds 加 密 ， 注 意 在 计算 md5 之 前 ,字符 串 1 必须 为 
UTF-8 编码 )。 

















sign=md5 (2015063000000001lapple143566028812345678) 
sign=f89f9594663708c1605f3d736d01d2d4 


通过 Python 提供 的 hashlib 模块 中 的 hashlib.md5() 可 以 实现 签名 计算 。 例 如 : 
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import hashlib 
m="2015063000000001lapple143566028812345678" 
m MD5=hashlib.md5 (m) 

sign=m MD5.hexdigest () 

print( 'm="',m) 

print ('sign="',sign) 


在 得 到 签名 之 后 ， 按 照 百度 文档 中 的 要 求生 成 URL 请 求 ， 提 交 后 可 返回 翻译 结果 。 
其 完整 请 求 如 下 : 
http://api.fanyi.baidu.com/api/trans/vip/translate?q=apple&from=en&to=zh&appid=201506 





3000000001&salt=1435660288&sign=f89f9594663708c1605f3d736d01d2d4 


用 户 也 可 以 使 用 post 方法 传送 需要 的 参数 。 
本 例 采 用 urllib.request.urlopen() 函 数 中 的 data 参数 向 服务 器 发 送 数 据 。 
下 面 是 发 送 data 的 实例 ， 向 “百度 翻译 ”发 送 要 翻译 数据 data， 得 到 翻译 结果 。 


#-*- coding: UTF-8 一 # 一 

from tkinter import * 

from urllib import request 

from urllib import parse 

import json 

import hashlib 

def translate Word(en str): 
#simulation browse load host url,get cookie 
URL="'http://api.fanyi.baidu.com/api/trans/vip/translate'"' 
#en_str=input ("请 输入 要 翻译 的 内 容 :") 
# 创 建 Form Data 字典 ， 存 储 向 服务 器 发 送 的 data 
#Form Data={'from':'en','to':'zh','q':en str,"appid": 
'2015063000000001','salt':'1435660288'} 
Form Data={} 


Form Data["from']='"en'" 
Form Datal[l'to']="'zh" 
Form Data['q']=en str # 要 翻译 数据 


Form Data['appid']="'2015063000000001' ”申请 的 APP ID 
Form Data['salt']="'1435660288" 

Key="12345678" # 平 台 分 配 的 密 钥 
m=Form Data['appid']+en str+Form Data['salt']+Key 

m MD5=hashlib.md5 (m.encode ('utf8')) 

Form Data['sign']=m MD5.hexdigest () 





data=parse.urlencode (Form Data) .encode ('utf-8') 


# 使 用 urlencode () 方法 转换 标准 格式 


response=request .urlopen (URL, data) # 传 递 Request 对 象 和 转换 完 格式 的 数据 
html=response.read() -decode ('utf-8') ## 读 取信 息 并 解码 
translate results=j son.loads (html) # 使 用 JSON 








第 4 章 调用 百度 API 应 用 一 一 小 小 翻译 器 
print (translate results) # 打 印 出 JSON 数据 
translate results=translate results['trans result'"'] [0] ['dst'] 

# 找 到 翻译 结果 


print ("翻译 的 结果 是 : $s" 科 translate results) # 打 印 翻译 信息 
return translate results 

def leftClick (event): # “翻译 ”按钮 事件 函数 
en str=Entryl.get() # 获 取 要 翻译 的 内 容 
print (en str) 
vText=translate Word(en str) 


Entry2.config (Entry2, text=vText) # 修 改 翻 译 结果 框 文字 
Ssel( 
Entry2.insert (0,vText) 

def leftclick2 (event): # “清空 ”按钮 事件 函数 
SoestEn 


Entry2.insert (0,"") 
这 样 就 可 以 查看 翻译 的 结果 了 ， 如 下 : 


输入 要 翻译 的 内 容 : I am a teacher 
翻译 的 结果 是 : 我 是 个 教师 。 


此 时 得 到 的 JSON 数据 如 下 : 


ro en Eo i ransiresult GE 我 是 个 改 师 本 Sr 
'I am a teacher'}]} 


其 返回 结果 是 JSON 格式 ， 包 含 表 4-2 中 的 字段 。 
表 4-2 ”翻译 结果 的 JSON 字段 
| 类 型 | 
TEXT 
TEXT 


翻译 源 语言 


MIXED LIST 


trans_result 中 包含 了 src 和 dst 字段 。 

JSON 是 一 种 轻 量 级 的 数据 交换 格式 ， 其 中 保存 了 用 户 想 要 的 翻译 结果 ， 需 要 从 息 取 
到 的 内 容 中 找到 JSON 格式 的 数据 ， 再 将 得 到 的 JSON 格式 的 翻译 结果 解析 出 来 。 

这 里 向 服务 器 发 送 数据 Form_ Data 也 可 以 直接 如 下 写 : 

Form Data={'from':'en', 'to':'zh', '"q':en str,"appid": 

'2015063000000001', "salt': '1435660288"'} 


现在 只 是 将 英文 翻译 成 中 文 ， 稍 微 改 一 下 就 可 以 将 中 文 翻译 成 英文 了 : 





Form Data={"'from’:’'zh', "to':"en’', "gq':en str,''"appid"': 
'2015063000000001', "salt': '1435660288"'} 


这 一 行 中 的 fom 和 to 的 取 值 应 该 可 以 用 于 其 他 语言 之 间 的 翻译 。 如 果 源 语言 语种 不 
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确定 可 设置 为 auto, 注意 目标 语言 语种 不 可 设置 为 auto。 百度 翻译 支持 的 语言 简写 如 表 4-3 



































所 示 。 
表 4-3 百度 翻译 支持 的 语 

语言 简写 名 称 名 称 
auto 自动 检测 保加利亚 语 
zh 中 文 爱沙尼亚 语 
en 英语 丹麦 语 
yue 粤语 兰 语 
WyW, 冯 至 文 捷克 语 
Pp 日 语 罗马 尼 亚 语 
kor 韩语 斯 洛 文 尼 亚 语 
fra 法 语 瑞典 语 
spa 西班牙 语 匈牙利 语 
也 泰语 cht 繁体 中 文 
ara 阿拉 伯 语 越南 语 
m 俄语 | aq | 希腊 语 
Pt 葡萄 牙 语 荷兰 语 
de 德语 | ph | 波兰 语 


请 读者 查阅 资料 编程 ， 向 有 道 翻 译 (http://fanyi.youdao.com/translate?smartresult=dict) 
发 送 要 翻译 数据 data， 得 到 翻译 结果 。 








5.1 校园 网 搜索 引擎 功能 分 析 


随 着 校园 网 建设 的 迅速 发 展 ， 校 园 网 内 的 信息 内 容 正在 以 惊人 的 速度 。 视频 讲解 
增加 着 。 如 何 更 全 面 、 更 准确 地 获取 最 新 、 最 有 效 的 信息 已 经 成 为 人 们 把 握 机 遇 、 迎 接 挑 
战 和 获取 成 功 的 重要 条 件 。 目 前 虽然 已 经 有 了 像 Google、 百 度 这 样 优秀 的 通用 搜索 引擎， 
但 是 它们 并 不 能 适用 于 所 有 的 情况 和 需要 。 对 学 术 搜 索 、 校 园 网 的 搜索 来 说 ， 一 个 合理 的 
排序 结果 是 非常 重要 的 。 另外， 互联 网 上 的 信息 量 巨大 ， 远 远 超出 哪怕 是 最 大 的 一 个 搜索 
引擎 可 以 完全 收集 的 能 力 范围 。 本 章 旨 在 使 用 Python 建立 一 个 适合 校园 网 使 用 的 Web 搜 
索引 警 系 统 ， 它 能 在 较 短 的 时 间 内 疏 取 页 面 信息 ， 具 有 有 效 、 准 确 的 中 文 分 词 功能 ， 能 实 
现 对 校园 网 上 新 闻 信 息 的 快速 检索 展示 。 


5.2 ”校园 网 搜索 引擎 系统 设计 


校园 网 搜索 引擎 一 般 需 要 以 下 几 个 步骤 ; 

(1) 网 络 疏 虫 疏 取 这 个 网 站 ， 得 到 所 有 网 页 链接 。 

网 络 疏 虫 就 是 一 只 会 嗅 着 URL (链接 ) 疏 过 成 千 上 万 个 网 页 ， 并 把 网 页 内 容 搬 到 用 户 
计算 机 上 供用 户 使 用 的 苦力 虫子 。 如 图 5-1 所 示 ， 给 定 候 虫 的 出 发 页 面 A 的 URL， 它 就 从 
起 始 页 A 出 发 ， 读 取 A 的 所 有 内 容 ， 并 从 中 找到 5 个 URL， 分 别 指向 页 面 B、C、D、E 
和 了 ， 然 后 它 顺 着 链接 依次 抓 取 B、C、D、E 和 下 页 面 的 内 容 ， 并 从 中 发 现 新 的 链接 ， 再 
沿 着 链接 疏 到 新 的 页 面 ， 对 疏 虫 带 回来 的 网 页 内 容 分 析 链 接 ， 继 续 爬 到 新 的 页 面 ， 以 此 类 
推 ， 直 到 找 不 到 新 的 链接 或 者 满足 了 人 为 设 定 的 停止 条 件 为 止 。 

至 于 这 只 虫子 前 进 的 方式 ， 则 分 为 广度 优先 搜索 (BFS) 和 深度 优先 搜索 (DFS)。 在 
这 张 图 中 BFS 的 搜索 顺序 是 A-B-C-D-E-F-G-H-I， 而 深度 优先 搜索 的 顺序 是 遍历 的 路 径 ， 








| 项 目 案例 开发 


从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 
即 A-F-G E-H-I BCD。 


图 5-1 网 站 链接 示意 图 


(2) 得 到 网 页 的 源 代码 ， 解 析 剥 离 出 想 要 的 新 闻 内 容 、 标 题 、 作 者 等 信息 。 
(3) 把 所 有 网 页 的 新 闻 内 容 做 成 词 条 索引 ， 一 般 采 用 倒 排 表 索引 。 
索引 一 般 有 正 排 索引 〈 正 向 索引 )》 和 倒 排 索引 《〈 反 向 索引 ) 两 种 类 型 。 
。 正 排 索引 《〈 正 向 索引 ，forward index): 正 排 表 是 以 文档 的 ID 为 关键 字 ， 表 中 记录 
文档 〈 即 网 页 ) 中 每 个 字 或 词 的 位 置信 息 ， 查 找 时 扫描 表 中 每 个 文档 中 字 或 词 的 信 
息 直 到 找 出 所 有 包含 查询 关键 字 的 文档 。 
正 排 表 的 结构 如 图 5-2 所 示 ， 这 种 组 织 方法 在 建立 索引 的 时 候 结构 比较 简单 ， 建 立 比 
较 方 便 上 且 易 于 维护 ， 因 为 索引 是 基于 文档 建立 的 ， 若 是 有 新 的 文档 加 入 ， 直 接 为 该 文档 建 
立 一 个 新 的 索引 块 ， 挂 接 在 原来 索引 文件 的 后 面 。 若 是 有 文档 删除 ， 则 直接 找到 该 文档 号 
文档 对 应 的 索引 信息 ， 将 其 直接 删除 。 但 是 在 查询 的 时 候 需 要 对 所 有 的 文档 进行 扫描 以 确 
保 没有 遗漏 ， 这 样 就 使 得 检索 时 间 大 大 延长 ， 检 索 效 率 低下 。 
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单词 2 上 | 











图 5-2 正 排 表 结构 示意 图 


尽管 正 排 表 的 工作 原理 非常 简单 ， 但 是 由 于 其 检索 效率 太 低 ， 除 非 在 特定 情况 下 ， 否 
则 实用 价值 不 大 。 

。 倒 排 索引 〈 反 向 索引 ，inverted index): 倒 排 表 以 字 或 词 为 关键 字 进 行 索引 ， 表 中 关 
键 字 所 对 应 的 记录 表 项 记录 了 出 现 这 个 字 或 词 的 所 有 文档 ， 一 个 表 项 就 是 一 个 字 表 
段 ， 它 记录 该 文档 的 ID 和 字符 在 该 文档 中 出 现 的 位 置 情况 。 
由 于 每 个 字 或 词 对 应 的 文档 数量 在 动态 变化 ， 所 以 倒 排 表 的 建立 和 维护 都 较为 复杂 ， 
但 是 在 查询 的 时 候 由 于 可 以 一 次 得 到 查询 关键 字 所 对 应 的 所 有 文档 ,所 以 效率 高 于 正 排 表 。 
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在 全 文 检索 中 ， 检 索 的 快速 响应 是 一 个 最 为 关键 的 性 能 ， 而 索引 的 建立 由 于 在 后 台 进 行 ， 
尽管 效率 相对 低 一 些 ， 但 不 会 影响 整个 搜索 引擎 的 效率 。 





























倒 排 表 的 结构 如 图 5-3 所 示 。 
单词 1 | 文档 1 FE 文档 2 = 
-一 
单词 | 上 一 档 1 | 构 2 Es 

















图 5-3” 倒 排 表 结构 示意 图 


正 排 索引 是 从 文档 到 关键 字 的 映射 〈 已 知 文档 求 关键 字 )， 倒 排 索引 是 从 关键 字 到 文 
档 的 映射 〈 已 知 关键 字 求 文档 )。 

在 搜索 引擎 中 每 个 文件 都 对 应 一 个 文件 ID,， 文 件 内 容 被 表示 为 一 系列 关键 词 的 集合 
(实际 上 ， 在 搜索 引擎 索引 库 中 关键 词 已 经 转换 为 关键 词 ID )。 例 如 “文档 1” 经 过 分 词 提 
取 了 20 个 关键 词 , 每 个 关键 词 都 会 记录 它 在 文档 中 的 出 现 次 数 和 出 现 位 置 , 得 到 正 向 索引 
的 结构 如 下 : 

“文档 1” 的 ID > 单词 1: 出 现 次 数 ， 出 现 位 置 列表 ; 单词 2: 出 现 次 数 ， 出 现 位 置 列表 ; …… 

“文档 2” 的 ID > 此 文档 出 现 的 关键 词 列表 


当 用 户 搜 索 关键 词 “ 华 为 手机 ”时 ,假设 只 存在 正 向 索引 forward index)， 那 么 就 需 
要 扫描 索引 库 中 的 所 有 文档 ， 找 出 所 有 包含 关键 词 “ 华 为 手机 ”的 文档 ， 再 根据 打分 模型 
进行 打分 ， 排 出 名 次 后 呈现 给 用 户 。 因 为 互联 网 上 收录 在 搜索 引擎 中 的 文档 的 数目 是 个 天 
文 数字 ， 这 样 的 索引 结构 根本 无 法 满足 实时 返回 排名 结果 的 要 求 。 所 以 搜索 引擎 会 将 正 向 
索引 重新 构建 为 倒 排 索引 ， 即 把 文件 ID 对 应 到 关键 词 的 映射 转换 为 关键 词 到 文件 ID 的 映 
射 ， 每 个 关键 词 都 对 应 一 系列 的 文件 ， 这 些 文件 中 都 出 现 这 个 关键 词 ， 得 到 倒 排 索引 的 结 
构 如 下 : 

“单词 证 起 “文档 bd 的 ID， < 侈 档 pl 的 Dy ETT 

“单词 2”， 带 有 此 关键 词 的 文档 ID 列表 


(4) 搜索 时 ， 根 据 搜索 词 在 词 条 索引 中 查询 ， 按 顺序 返回 相关 的 搜索 结果 ， 也 可 以 按 
网 页 评价 排名 顺序 返回 相关 的 搜索 结果 。 

当 用 户 输入 一 串 搜索 字符 串 时 ， 程 序 会 先进 行 分 词 ， 然 后 依照 每 个 词 的 索引 找到 相应 
网 页 。 假 如 在 搜索 框 中 输入 “从 前 有 座 山 山里 有 座 庙 小 和 尚 ”搜索 引擎 首先 会 对 字符 串 进 
行 分 词 处 理 “ 从 前 /有 / 座 山 /山里 /有 / 座 庙 / 小 和 尚 ” 然后 按照 一 定 的 规则 对 词 做 布尔 运算 ， 
例如 每 个 词 之 间 做 “与 ”运算 ， 在 索引 中 搜索 “同时 ”包含 这 些 词 的 页 面 。 

所 以 本 系统 主要 由 以 下 4 个 模块 组 成 。 

。 信息 采集 模块 : 主要 是 利用 网 络 爬 虫 实现 对 校园 网 信息 的 抓 取 。 

。 索引 模块 : 负责 对 爬 取 的 新 闻 网 页 的 标题 、 内 容 和 作者 进行 分 词 并 建立 倒 排 词 表 。 
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从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


。 网 页 排名 模块 : TF/IDF 是 一 种 统计 方法 , 用 于 评估 一 字 词 对 于 一 个 文件 集 或 一 个 语 
料 库 中 的 一 份 文件 的 重要 程度 。 
。 用 户 搜索 界面 模块 : 负责 用 户 关键 字 的 输入 以 及 搜索 结果 信息 的 返回 


5.3 ”关键 技术 


5.3.1 正则 表达 式 


把 网 页 中 的 超 链接 提取 出 来 需要 使 用 正则 表达 式 。 那 么 什么 是 正则 表达 式 ? 在 回答 这 
个 问题 之 前 先 来 看 一 看 为 什么 要 有 正则 表达 式 。 

在 编程 处 理 文本 的 过 程 中 ， 经 常 需要 按照 某 种 规则 去 查找 一 些 特 定 的 字符 串 。 例 如 知 
道 一 个 网 页 上 的 图 片 都 叫 “image/8554278135.jpg” 之 类 的 名 字 ， 只 是 那 串 数字 不 一 样 ， 又 
或 者 在 一 堆 人 员 的 电子 档案 中 ， 要 把 他 们 的 电话 号 码 全 部 找 出 来 ， 整 理 成 通讯 录 。 诸 如 此 
类 工作 ， 可 不 可 以 利用 这 些 规 律 ， 让 程序 自动 来 做 这 些 事情 ? 答案 是 肯定 的 。 这 时 候 就 需 
要 一 种 描述 这 些 规 律 的 方法 ， 正 则 表达 式 就 是 描述 文本 规则 的 代码 。 

正则 表达 式 是 一 种 用 来 匹配 字符 串 文 本 的 强 有 力 的 武器 。 we 种 描述 性 的 语言 来 
给 字符 串 定义 一 个 规则 。 凡 是 符合 规则 的 字符 串 ， 就 认为 它 ”了 ， 和 否则 该 字符 串 就 
是 不 合法 的 。 

@ 正则 表达 式 的 语法 

正则 表达 式 并 不 是 Python 中 特有 的 功能 ， 它 是 一 种 通用 的 方法 ， 要 使 用 它 必 须 会 用 正 
则 表达 式 来 描述 文本 规则 。 

正则 表达 式 使 用 特殊 的 语法 来 表示 ， 表 5-1 列 出 了 正则 表达 式 的 语法 。 

表 5-1 正则 表达 式 的 语法 























模 式 描述 
和 匹配 字符 串 的 开头 
$ 匹配 字符 囊 的 末尾 

匹配 任意 字符 ， 除 了 换行 符 





用 来 表示 一 组 字符 ， 例 如 [amk] 匹 配 'a'、'mm' 或 必 ，[0-9] 匹 配 任何 数字 ， 类 似 于 
上] [0123456789]，[a-z] 匹 配 任何 小 写字 母 ，[a-zA-Z0-9] 匹 配 任何 字母 及 数字 

不 在 [中 的 字符 ， 例 如 [^abc] 匹 配 除了 a、b、c 之 外 的 字符 ，[^0-9] 匹 配 除 了 数字 之 
[ 外 的 字符 






































数量 词 ， 匹 配 0 个 或 多 个 

4 数量 词 ， 匹 配 1 个 或 多 个 

2 数量 词 ， 以 非 灸 禁 方 式 匹配 0 个 或 1 个 

{n,} 重复 n 次 或 更 多 次 

{n,m} 重复 n 一 冲 次 

alb 匹配 a 或 b 

(re) 匹配 括号 内 的 表达 式 ， 也 表示 一 个 组 

(?imx) 正则 表达 式 包含 3 种 可 选 标 志 ， 即 i、m、x， 只 影响 括号 中 的 区 域 
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模 式 描 述 

(9-imx) 正则 表达 式 关闭 i、m 或 x 可 选 标志 ， 只 影响 括号 中 的 区 域 

(2:re) 类 似 (…)， 但 是 不 表示 一 个 组 

(imx: re) 在 括号 中 使 用 i、m 或 x 可 选 标志 

(?-imx: re) 在 括号 中 不 使 用 i、m 或 x 可 选 标志 
前 向 肯定 界定 符 ， 如 果 所 含 正则 表达 式 以 .… 表 示 , 在 当前 位 置 成 功 匹 配 时 成 功 ， 否 

(2= re) 则 失败 。 一 旦 所 含 表达 式 已 经 尝试 ， 匹配 引擎 根本 没有 提高 ,模式 的 剩余 部 分 还 要 
尝试 界定 符 的 右边 

eta 前 向 否定 界定 符 , 与 前 面 肯定 界定 符 相 反 ,， 当 所 含 表 达 式 不 能 在 字符 串 当前 位 置 匹 
配 时 成 功 

(2> re) 匹配 的 独立 模式 ， 省 去 回溯 

\w 匹配 字母 、 数 字 及 下 画 线 ， 等 价 于 '[A-Za-z0-9 】 

WW 匹配 非 字 母 、 数 字 及 下 面 线 ， 等 价 于 '[^A-Za-z0-9 ] 

\s 匹配 任何 空白 字符 ， 包 括 空格 、 制 表 符 、 换 页 符 等 ， 等 价 于 [ \fn\tWw] 

\S 匹配 任何 非 空白 字符 ， 等 价 于 [^ \fmwtwv] 

\d 匹配 任意 数字 ， 等 价 于 [0-9] 

\D 匹配 任意 非 数 字 ， 等 价 于 [^0-9] 

\A 匹配 字符 串 开始 

记 匹配 字符 串 结束 ， 如 果 存 在 换行 ， 只 匹配 到 换行 前 的 结束 字符 串 

\z 匹配 字符 串 结 束 

\G 匹配 最 后 匹配 完成 的 位 置 

由 匹配 一 个 单词 边界 ， 也 就 是 单词 和 空格 间 的 位 置 。 例 如 ，'eb' 可 以 匹配 "never" 中 的 
'er， 但 不 能 匹配 "verb" 中 的 'er' 

\B 匹配 非 单词 边界 ， 例 如 'erB' 能 匹配 "verb" 中 的 'er， 但 不 能 匹配 "never" 中 的 'er 

\n、\t 等 匹配 一 个 换行 符 、 一 个 制 表 符 等 

正则 表达 式 通常 用 于 在 文本 中 查找 匹配 的 字符 串 。 在 Python 中 数量 词 默认 是 贪 禁 的 ， 


总 是 尝试 匹配 尽 可 





能 多 的 字符 ; 非 贪 禁 的 则 相反 ， 总 是 尝试 匹配 尽 可 能 少 的 字符 。 例 如 ， 


正则 表达 式 "ab*" 如 果 用 于 查找 "abbbc"， 将 找到 "abbb"; 如果 使 用 非 贪 禁 的 数量 词 "nab*?"， 


将 找到 "a"。 
在 正则 表达 式 
到 用 \d 可 以 匹配 一 

















中 ， 如 果 直 接 给 出 字符 ， 就 是 精确 匹配 。 从 正则 表达 式 语 法 中 能 够 了 解 
个 数字 ， 用 \w 可 以 匹配 一 个 字母 或 数字 ， 用 .可 以 匹配 任意 字符 ， 所 以 模 








式 '00\d' 可 以 匹配 '007'， 但 无 法 匹配 '00A';， 模式 \d\d\d' 可 以 匹配 '010'"， 模 式 \wiww\d' 可 以 匹配 











'py3';， 模式 'py. 可 以 匹配 pyc'、'pyo'、'py!'， 等 等 。 


如 果 要 匹配 变 








长 的 字符 , 在 正则 表达 式 模式 字符 串 中 用 * 表 示 任 意 个 字符 (包括 0 个 )， 




















个 字符 。 这 里 看 一 
从 左 到 右 解读 








+ 表示 至 少 一 个 字符 , 用 ?表示 0 个 或 1 个 字符 , 用 {n} 表 示 n 个 字符 , 用 fnm} 表 示 n 一 mm 





个 复杂 的 表示 电话 号 码 的 例子 ， 即 \d{3j}\s+vd{3.8} 。 
二 


\d{3} 表 示 匹 配 3 个 数字 ， 例 如 '010'; 


\ 可 以 匹配 一 


个 空格 〈 也 包括 Tab 等 空白 符 )， 所 以 \s+ 表 示 至 少 有 一 个 空格 ; 


\d{3,8} 表 示 3 一 8 个 数字 ， 例 如 '67665230'。 


综合 起 来 ， 上 


面 的 正则 表达 式 可 以 匹配 以 任意 个 空格 隔 开 的 带 区 号 的 电话 号 码 。 
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从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
如 果 要 匹配 '010-67665230' 这 样 的 号 码 ， 怎 么 办 ? 由 于 '-'. 是 特殊 字符 ， 在 正则 表达 式 中 








要 用 \' 转 义 ， 所 以 上 面 的 正则 表达 式 是 \d{3}\\d{3,8}。 











如 果 要 做 更 精确 的 匹配 ， 可 以 用 [] 表 示范 围 ， 例 如 : 
[0-9a-zA- 妈 ] 可 以 匹配 一 个 数字 、 字 母 或 者 下 面 线 ; 
[0-9a-zA- 妈 + 可 以 匹配 至 少 由 一 个 数字 、 字 母 或 者 下 画 线 组 成 的 字符 串 ， 例 如 'a100'、 


'0_Z'、'Py3000' 等 ; 


[a-zA-Z\_][0-9a-zA-Z\ ]* 可 以 匹配 以 字母 或 下 夯 线 开头 ， 后 接任 意 个 由 一 个 数字 、 字 





母 或 者 下 画 线 组 成 的 字符 串 ， 也 就 是 Python 合法 的 变量 ; 











[a-zA-Z\_][0-9a-zA-Z\ ]{0, 19} 更 精确 地 限制 了 变量 的 长 度 是 1 一 20 个 字符 (前 面 1 个 














字符 + 后 面 最 多 19 个 字符 )。 





另外 ，AIB 可 以 匹配 A 或 B， 所 以 (Plp)ython 可 以 匹配 Python' 或 者 python'。 

^ 表 示 行 的 开头 ，^\d 表示 必须 以 数字 开头 。 

$ 表 示 行 的 结束 ，\d$ 表 示 必 须 以 数字 结束 。 

@ re 模块 

Python 提供 了 re 模块 ， 包 含 所 有 正则 表达 式 的 功能 。 

1) match() 方 法 

re.match() 的 格式 为 re.match(pattern, string, flags)。 

其 第 1 个 参数 是 正则 表达 式 , 第 2 个 参数 表示 要 匹配 的 字符 串 ; 第 3 个 参数 是 标志 位 ， 


用 于 控制 正则 表达 式 的 匹配 方式 ， 例 如 是 否 区 分 大 小 写 、 多 行 匹配 等 。 
match() 方 法 判断 是 否 匹配 ， 如 果 匹 配 成 功 ， 返 回 一 个 Match 对 象 ， 否 则 返回 None。 
常见 的 判断 方法 如 下 : 


test=' 用 户 输入 的 字符 串 ' 

if re.match (r' 正 则 表达 式 '，test) : ”#T 前 级 为 原 义 字符 串 ， 它 表示 对 字符 串 不 进行 转 义 
print('ok') 

JS 
print('"failed') 

例如 : 

>>> import re 

>>> re.match(r'^\d{3}\-\d{3,8}$'，'010-12345') # 返 回 一 个 Match 对 象 

< sre.SRE Match object; span=(0,9), match="'010-12345'> 


>>> re.match(r'^\d{3}\-\d{3,8}$', '010 12345') 
#"010 12345' 不 匹配 规则 ， 返 回 None 


Match 对 象 是 一 次 匹配 的 结果 ， 包 含 了 很 多 关于 此 次 匹配 的 信息 ， 可 以 使 用 Match 提 


供 的 可 读 属 性 或 方法 来 获取 这 些 信 息 。 


Match 属性 如 下 : 

。 string: 匹配 时 使 用 的 文本 。 

。 re: 匹配 时 使 用 的 Pattern 对 象 。 

。 pos: 文本 中 正则 表达 式 开始 搜索 的 索引 , 值 与 Pattern.match() 和 Pattern.search() 方 法 
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的 同名 参数 相同 。 

。 endpos: 文本 中 正则 表达 式 结束 搜索 的 索引 ， 值 与 Pattern.match0 和 Pattern.search() 
方法 的 同名 参数 相同 。 

。 lastindex: 最 后 一 个 被 捕获 的 分 组 在 文本 中 的 索引 。 如 果 没 有 被 捕获 的 分 组 ， 将 为 
None。 

。 lastgroup: 最 后 一 个 被 捕获 的 分 组 的 别名 。 如 果 这 个 分 组 没有 别名 或 者 没有 被 捕获 
的 分 组 ， 将 为 None。 

Match 方法 如 下 : 

。 group([group1, .…]): 获得 一 个 或 多 个 分 组 截获 的 字符 串 ， 当 指定 多 个 参数 时 将 以 元 
组 形式 返回 。 参 数 group1 可 以 使 用 编号 也 可 以 使 用 别名 ; 编号 0 代表 整个 匹配 的 子 

串 ， 当 不 填写 参数 时 返回 group(0); 没有 截获 字符 串 的 组 返回 None; 截获 了 多 次 的 

组 返回 最 后 一 次 截获 的 子 串 。 

groups([default]): 以 元 组 形式 返回 全 部 分 组 截获 的 字符 串 , 相当 于 调用 group(1.2,….， 

last)。default 表示 没有 截获 字符 串 的 组 以 这 个 值 蔡 代 ， 默 认为 None。 

groupdict([default]): 返回 以 有 别名 的 组 的 别名 为 键 、 以 该 组 截获 的 子 串 为 值 的 字典 ， 

没有 别名 的 组 不 包含 在 内 。default 的 含义 同上 。 

start([group]): 返回 指定 的 组 截获 的 子 串 在 string 中 的 起 始 索引 ( 子 串 第 1 个 字符 的 

索引 )。group 的 默认 值 为 0。 

end([group]): 返回 指定 的 组 截获 的 子 串 在 string 中 的 结束 索引 〈 子 串 最 后 一 个 字符 

的 索引 +1)。group 的 默认 值 为 0。 

。 span([group]): 返回 (start(group), end(group))。 

Match 对 象 的 相关 属性 和 方法 示例 如 下 : 

import re 

oh he 

m=re.match(r'^(\d\d)\:(\d\d)\:(\d\d)s$', t) #r 原 义 

print ("m.string:", m.string) #m.string: 19:05:25 

print (m.re) #re.compile('~^(\\d\d) WN\: (dN) WN\: ((\\d\\d))$') 

print ("m.pos:", m.pos) #m.pos: 0 

#m.endpos: 8 

#m.1lastindex: 3 














print ("m.endpos:", m.endpos) 
print("m.lastindex:", m.lastindex) 


print("m.lastgroup:", m.lastgroup) #m.lastgroup: None 


print ("m.group(0):", m.group (0) ) 


print ("m.group(1,2):", m.group(1, 2)) 


print ("m.groups():", m.groups()) 


print ("m.groupdict():", m.groupdict ()) 


print ("m.start (2):", m.start (2)) 
print ("m.end(2):", m.end(2)) 
print ("m.span(2):", m.span(2)) 


关于 分 组 的 内 容 见 后 面 。 

















#m.group(0): 19:05:25 

4m gronptlr 2 0 9 OS) 
mrounsit) LD OS M250) 
#m.groupdict(): {} 
#m.start (2): 3 

#m.end(2): 5 

#m.span (2): (3, 5) 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


2) 分 组 
除了 简单 地 判断 是 否 匹配 之 外 ， 正 则 表达 式 还 有 提取 子 串 的 强大 功能 ， 用 (0 表示 的 就 


是 要 提取 的 分 组 。 例 如 ^(df3))-(Cd{3.8)3 分 别 定义 了 两 个 组 ， 可 以 直接 从 匹配 的 字符 串 中 








提取 出 区 号 和 本 地 号 码 : 
>>> m=re.match(r'^(\d{3})=(\d{3,8})$", "010=12345°") 
>>> m.group (0) #0E0=12345” 
>>> m.group (1) #"010" 
>>> m.group (2) #"'12345" 


如 果 正 则 表达 式 中 定义 了 组 , 就 可 以 在 Match 对 象 上 用 group0 方 法 提取 出 子 串 。 注意 





group(0) 永 远 是 原始 字符 串 ，group(1)、group(2) 表 示 第 1、2 个 子 串 。 


3) 切 分 字符 串 
用 正则 表达 式 切 分 字符 串 比 用 固定 的 字符 更 灵活 ， 请 看 普通 字符 串 的 切 分 代码 : 


SS ple #split ('， ') 表 示 按 空格 分 隔 
eo Me doe ou oe 


其 结果 是 无 法 识别 连续 的 空格 ,可 以 使 用 re.split0 方 法 来 分 割 字符 串 , 例 如 re.split(r\s+'， 


text) 将 字符 串 按 空格 分 割 成 一 个 单词 列表 : 











mn 





>>> Fe apIIiE(r NOt Sql Db cu # 用 正则 表达 式 

人 

无 论 多 少 个 空格 都 可 以 正常 分 割 。 

再 例如 分 隔 符 既 有 空格 又 有 有 逗号 、 分 号 的 情况 : 

D> re SD NN SEED ES # 可 以 识别 空格 、 喜 号 

J ret pt 

>>> re.split(r'[\s\,\;]+'，'asb;; c d') ，# 可 以 识别 空格 、 喜 号 、 分 号 
人 

4) search() 和 findall() 方 法 

Ie.match() 总 是 从 字符 串 “ 开 头 ” 去 匹配 ， 并 返回 匹配 的 字符 串 的 Match 对 象 ， 所 以 当 


re.match() 去 匹配 非 “ 开 头 ” 部 分 的 字符 串 时 会 返回 None。 





stri="Hello World!" 
print (re.match(r'World', str1)) # 结 果 为 None 


如 果 想 在 字符 串 中 的 任意 位 置 去 匹配 ， 请 用 re.search() 或 re.findall()。 
re.search() 将 对 整个 字符 串 进行 搜索 ， 并 返回 第 1 个 匹配 的 字符 串 的 Match 对 象 。 


strl="'Hello Worldl! " 
print (re.search (r'World', str1)) 


输出 结果 如 下 : 
<_sre.SRE Match object; span=(6,11), match='World'> 


re.findall0 函 数 将 返回 一 个 所 有 匹配 的 字符 串 的 字符 串 列表 。 例 如 : 
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strl="Hi，I am Shirley Hilton. I am his wife." 
>>> print (re.search(r'hi',str1)) 


以 上 代码 的 输出 结果 如 下 : 

<_sre.SRE Match object; span=(10, 12), match='hi'> 

此 时 应 用 re.findall0 函 数 : 

>>> re.findall(r'hi',str1) 

输出 结果 如 下 : 

Tean nil 

这 两 个 “hi” 分 别 来 自 “Shirley” 和 “his”。 在 默认 情况 下 正则 表达 式 是 严格 区 分 大 小 
写 的 ， 所 以 “Hi” 和 “Hilton” 中 的 “Hi” 被 忽略 了 。 

如 果 只 想 找到 “hi” 这 个 单词 ,而 不 把 包含 它 的 单词 计算 在 内 ， 那 就 可 以 使 用 “\bhi\b” 
这 个 正则 表达 式 。“\b” 在 正则 表达 式 中 表示 单词 的 开头 或 结尾 ， 空 格 、 标 点 、 换 行 都 算是 
单词 的 分 割 ， 而 “\b” 自 身 又 不 会 匹配 任何 字符 ， 它 代表 的 只 是 一 个 位 置 ， 所 以 单词 前 后 
的 空格 、 标 点 之 类 不 会 出 现在 结果 中 。 

在 前 面 的 例子 中 ,“\bhivb ”匹配 不 到 任何 结果 ， 因 为 没有 单词 hl (“Hi” 不 是 ， 严 格 
分 大 小 写 )。 但 如 果 是 “\bhi”， 就 可 以 匹配 到 1 个 “hi”， 出自 “his”。 


5.3.2 ”中 文 分 词 


在 英文 中 ， 单 词 之 间 是 以 空格 作为 自然 分 界 符 的 ， 而 中 文 只 是 句子 和 上段 可 以 通过 明显 
的 分 界 符 来 简单 划分 ， 唯 独 词 没 有 一 个 形式 上 的 分 界 符 ， 虽 然 也 同样 存在 短语 之 间 的 划分 
问题 ， 但 是 在 词 这 一 层 上 ， 中 文 要 比 英文 复杂 得 多 。 

中 文 分 词 就 是 将 连续 的 字 序 列 按照 一 定 的 规范 重新 组 合成 词 序列 的 过 程 。 中 文 分 词 是 
网 页 分 析 索 引 的 基础 。 分 词 的 准确 性 对 搜索 引擎 来 说 十 分 重要 ， 如 果 分 词 速 度 太 慢 ， 即 使 
再 准确 ， 对 于 搜索 引擎 来 说 也 是 不 可 用 的 ， 因 为 搜索 引擎 需要 处 理 很 多 网 页 ， 如 果 分 析 消 
耗 的 时 间 过 长 ， 会 严重 影响 搜索 引擎 内 容 更 新 的 速度 。 因 此 ， 搜 索引 擎 对 于 分 词 的 准确 率 
和 速率 都 提出 了 很 高 的 要 求 。 

jieba 是 一 个 支持 中 文 分 词 、 高 准确 率 、 高 效率 的 Python 中 文 分 词组 件 ， 它 支持 繁体 
分 词 和 自 定 义 词 典 ， 并 支持 3 种 分 词 模式 。 

(1) 精确 模式 : 试图 将 句子 最 精确 地 切 开 ， 适 合 文本 分 析 。 

(2) 全 模式 : 把 句子 中 所 有 可 以 成 词 的 词语 都 扫描 出 来 ， 速 度 非常 快 ， 但 是 不 能 解决 
歧义 的 问题 。 

(3) 搜索 引擎 模式 : 在 精确 模式 的 基础 上 对 长 词 再 次 切 分， 提高 召回 率 ， 适 合用 于 搜 
索引 擎 分 词 。 


5.3.3 ”安装 和 使 用 jieba 


在 命令 行 中 输入 以 下 代码 : 











Xl 
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pip install jieba 
如 果 出 现 以 下 提示 则 安装 成 功 。 


Installing collected packages: jieba 
Running setup.py install for jieba ... done 
Successfully installed jieba-0.38 


组 件 提供 了 jieba.cut0 方 法 用 于 分 词 ，cut0 方 法 接受 两 个 输入 参数 : 

(1) 第 1 个 参数 为 需要 分 词 的 字符 串 。 

(2) cut all 参数 用 来 控制 分 词 模式 。 

jieba.cut0) 返 回 的 结构 是 一 个 可 夫 代 的 生成 器 (generator)， 可 以 使 用 for 循环 来 获得 分 
词 后 得 到 的 每 一 个 词语 ， 也 可 以 用 listGieba.cut(...)) 转 化 为 list 列表 。 例 如 : 

import jieba 

seg_1ist=jieba.cut ("我 来 到 北京 清华 大 学 "，cut_all=True) # 全 模式 

print ("Full Mode:", '/'.join(seg list)) 

seg 1ist=jieba.cut ("我 来 到 北京 清华 大 学 ") ”# 默 认 是 精确 模式 , 或 者 cut all =False 

print (type (seg list)) #<class 'generator'> 





print ("Default Mode:", '/'.join(seg list)) 
seg 1ist=jieba.cut for search ("我 来 到 北京 清华 大 学 ") “”# 搜 索引 擎 模式 
print ("搜索 引擎 模式 :"，'/'.join(seg list)) 
seg_1list=jieba.cut ("我 来 到 北京 清华 大 学 ") 
for word in seg list: 
print (word, end="' ') 


运行 结果 如 下 : 


Building prefix dict from the default dictionary ... 

Loading model from cache C:\Users\ADMINI~1\AppData\Local\Temp\jieba.cache 
Loading model cost 1.648 seconds. 

Prefix dict has been built succesfully. 

Full Mode: 我 /来 到 /北京 /清华 /清华 大 学 / 华 大 /大 学 

<class 'generator'> 

Default Mode: 我 /来 到 /北京 /清华 大 学 

搜索 引擎 模式 : 我 /来 到 /北京 /清华 / 华 大 /大 学 /清华 大 学 

我 来 到 北京 清华 大 学 


jieba.cut for search() 方 法 仅 有 一 个 参数 ， 为 分 词 的 字符 串 ， 该 方法 适用 于 搜索 引擎 构 
造 倒 排 索引 的 分 词 ， 粒 度 比较 细 。 


5.3.4 为 jieba 添加 自 定 义 词典 
国家 5A 级 景区 存在 很 多 与 旅游 相关 的 专 有 名 词 ， 举 个 例子 : 


[输入 文本 ] 故宫 的 著名 景点 包括 乾 清 宫 、 太 和 殿 和 黄 琉 璃 瓦 等 
[精确 模式 ] 故宫 /的 /著名 景点 /包括 / 乾 / 清 宫 /、/ 太 和 殿 / 和 / 黄 /琉璃 瓦 /等 
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[全 模式 ] 故 富 /的 /著名 /著名 景点 /景点 /包括 / 乾 / 清 宫 / 太 和 / 太 和 殿 / 和 / 黄 / 琉 璃 /琉璃 瓦 /等 

显然 ， 专 有 名 词 乾 清宫 、 太 和 殿 、 黄 琉璃 瓦 〈 假 设 为 一 个 文物 ) 可 能 因 分 词 而 分 开 ， 
这 也 是 很 多 分 词 工具 的 一 个 缺陷 。 但 是 jieba 分 词 支持 开发 者 使 用 自 定 定义 的 词典 ， 以 便 包 
含 jieba 词 库 里 没有 的 词语 。 虽 然 jieba 有 新 词 识别 能 力 ， 但 自行 添加 新 词 可 以 保证 更 高 的 
正确 率 ， 尤 其 是 专 有 名 词 。 

其 基本 用 法 如 下 : 

jieba.load userdict (file name) #file_name 为 自 定义 词典 的 路 径 

词典 格式 是 一 个 词 占 一 行 ， 每 一 行 分 3 个 部 分 ， 一 部 分 为 词语 ， 另 一 部 分 为 词 频 ， 最 
后 为 词性 (可 省 略 ，jieba 的 词性 标注 方式 和 ICTCLAS 的 标注 方式 一 样 。ns 为 地 点 名 词 ， 
nz 为 其 他 专用 名 词 ，a 是 形容 词 ，v 是 动词 ，d 是 副词 )，3 个 部 分 用 空格 隔 开 。 例 如 以 下 
自 定 义 词 典 dict.txt: 

乾 清 宫 5 ns 

黄 琉 璃 瓦 4 

云 计算 5 

李 小 福 2 nr 

八 一 双 应 3 nz 

凯特 琳 2 nz 


下 面 是 导入 自 定 义 词典 后 再 分 词 。 

import jieba 

jieba.load userdict ("dict.txt") # 导 入 自 定 义 词典 
text=" 故 富 的 著名 景点 包括 乾 清宫 、 太 和 殿 和 黄 琉 璃 瓦 等 " 

seg list=jieba.cut (text, cut all=False) # 精 确 模 式 

print (" [精确 模式 ] : "，"/ ".join(seg list)) 

输出 结果 如 下 ， 其 中 专 有 名 词 连 在 一 起 ， 即 乾 清宫 和 黄 琉璃 瓦 。 


[精确 模式 ] :故宫 / 的 / 著名 景点 / 包括 / 乾 清宫 / 、/ 太 和 殿 / 和 / 黄 琉璃 瓦 / 等 


5.3.5 文本 分 类 的 关键 词 提取 


当 文 本 分 类 时 ,在 构建 VSM (向 量 空间 模型 ) 的 过 程 中 或 者 把 文本 转换 成 数学 形式 的 
计算 中 ， 需 要 运用 到 关键 词 提取 的 技术 ，jieba 可 以 简便 地 提取 关键 词 。 
其 基本 用 法 如 下 : 


jieba.analyse.extract tags (sentence, topK=20, withWeight =False, allowPOS=()) 

这 里 需要 先 import jieba.analyse。 其 中 ，sentence 为 待 提取 的 文本 ; topK 为 返回 几 个 
TF/IDF 权重 最 大 的 关键 词 默认 值 为 20; withWeight 为 是 否 一 并 返回 关键 词 权重 值 , 默认 
值 为 False; allowPOS 指 仅 包含 指定 词性 的 词 ， 默 认 值 为 空 ， 即 不 进行 得 选 。 


import jieba,jieba.analyse 
jieba.load userdict ("dict.txt") # 导 入 自 定 义 词典 
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text=" 故 富 的 著名 景点 包括 乾 清宫 、 太 和 殿 和 午 门 等 。 其 中 乾 清宫 非常 精美 ， 午 门 是 紫禁城 的 
正门 ， 午 门 居中 向 阳 。" 
seg list=jieba.cut (text, cut all=False) 
print ("分 词 结果 : "，"/".join(seg list)) ## 精 确 模式 
tags=jieba.analyse.extract tags (text, topK=5) # 获 取 关 键 词 
print (" 关 键 词 : "，" ".join (tags) ) 
tags=jieba.analyse.extract tags (text，topK=5,withWeight=True) 

# 返 回 关键 词 权重 值 





print (tags) 
输出 结果 如 下 : 


分 词 结果 :故宫 /的 /著名 景点 /包括 / 乾 清宫 /、/ 太 和 殿 / 和 / 午 门 /等 /。/ 其 中 / 乾 清 宫 /非常 / 精 
美 /，/ 午 门 /是 /紫禁城 /的 /正门 /，/ 午 门 / 居 中 /向 阳 /。 

关键 词 : 午 门 乾 清宫 著名 景点 太 和 殿 向 阳 

[(' 午 门 '"，1.5925323525975001),(' 乾 清宫 '，1.4943459378625), (' 著名 景点 "， 
0.86879235325),，('" 太 和 殿 '，0.63518800210625)，(" 向 阳 '，0.578517922051875) ] 


其 中 ， 午 门 出 现 3 次 、 乾 清宫 出 现 两 次 、 著 名 景点 出 现 1 次 。 如 果 topK=5， 按 照 顺 序 输出 
提取 5 个 关键 词 ， 则 输出 “ 午 门 乾 清 宫 著名 景点 太 和 殿 向 阳 ”。 
jieba.analyse.TFIDF (idf_path=None)# 新 建 TF/IDF 实例 ，idf_path 为 IDF 频率 文件 
关键 词 提 取 所 使 用 的 逆向 文件 频率 (IDF) 文本 语料库 可 以 切换 成 自 定义 语料库 的 
路 径 。 
jieba.analyse.set idf path(file name) #file_name 为 自 定义 语料库 的 路 径 
关键 词 提取 所 使 用 的 停止 词 〈Stop Words) 文本 语料库 可 以 切换 成 自 定义 语料库 的 路 径 。 


说 明 : TF/IDF 是 一 种 统计 方法 , 用 于 评估 一 字 词 对 于 一 个 文件 集 或 一 个 语料库 中 的 一 
份 文件 的 重要 程度 。 字 词 的 重要 性 随 着 它 在 文件 中 出 现 的 次 数 成 正比 增加 ， 但 同时 会 随 着 
它 在 语料库 中 出 现 的 频率 成 反比 下 降 。TF/IDF 的 主要 思想 是 : 如 果 某 个 词 或 短语 在 一 篇 文 
章 中 出 现 的 频率 TF 高 ， 并 且 在 其 他 文章 中 很 少 出 现 ， 则 认为 此 词 或 者 短语 具有 很 好 的 类 
别 区 分 能 力 ， 适 合用 来 分 类 。 


5.3.6 deque 


deque (double-ended queue 的 缩写 ) 双向 队列 类 似 于 list 列表 ， 位 于 Python 标准 库 
collections 中 。 它 提供 了 两 端 都 可 以 操作 的 序列 ， 这 意味 着 在 序列 的 前 后 都 可 以 执行 添加 
或 删除 操作 。 

人 @ 创建 双向 队列 deque 


from collections import deque 











d=deque () 
@ 添加 元 素 
d=deque () 
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d.append (3) 

d.append (8) 

d.append (1) 

那么 此 时 d=deque([3,8,1])、len(d)=3、d[0]=3、d[-1]=1。 

deque 支持 从 任意 一 端 添加 元 素 。append0 用 于 从 右 端 添 加 一 个 元 素 ，appendleftO0 用 于 
从 左 端 添加 一 个 元 素 。 

全 两 端 都 使 用 pop 


CO De oA 


d.pop0 抛 出 的 是 '5'，d.popleft0 抛 出 的 是 '1'， 可 见 默认 popO 抛 出 的 是 最 后 一 个 元 素 。 
@ 限制 deque 的 长 度 


d=deque (maxlen=20) 























for i in range(30): 
d.append (str (i)) 


此 时 d 的 值 为 d=deque(['10', 11','12', '13', 14, '15', '16', '17', '18', '19', 20', '21', '22', 123 
24, 25', 26','27','28', '291], maxlen=20), 可 见 当 限制 长 度 的 deque 增加 超过 限制 数 的 项 时 另 
一 边 的 项 会 自动 删除 。 

@ 添加 list 的 各 项 到 deque 中 


d=deque ([1,2,3,4,5]) 
d.extend([0]) 


那么 此 时 d=deque([1,2,3,4,5,0])。 
d.extendleft ([6,7,8]) 


此 时 d=deque([8,7,6,1,2,3,4,5,0])。 


5.4 程序 设计 的 步骤 





5.4.1 信息 采集 模块 一 一 网 络 爬 虫 的 实现 





网 络 怜 虫 的 实现 原理 及 过 程 如 下 ; TE 

(1) 获取 初始 的 URL。 初 始 的 URL 地 址 可 以 由 用 户 指定 的 某 个 或 某 ”视频 讲解 
几 个 初始 候 取 网 页 决定 。 

(2) 根据 初始 的 URL 怜 取 页 面 并 获得 新 的 URL。 在 获得 初始 的 URL 地 址 之 后 ， 首 先 
需要 疏 取 对 应 URL 地 址 中 的 网 页 ， 在 爬 取 了 对 应 的 URL 地 址 中 的 网 页 后 将 网 页 存储 到 原 
始 数据 库 中 ， 并 且 在 爬 取 网 页 的 同时 发 现 新 的 URL 地 址 ， 将 已 朴 取 的 URL 地 址 存放 到 一 
个 已 候 URL 列表 中 ， 用 于 去 重复 判断 怜 取 的 进程 。 

(3) 将 新 的 URL 放 到 URL 队列 中 。 注 意 ， 在 第 2 步 中 获取 了 下 一 个 新 的 URL 地 址 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
之 后 会 将 新 的 URL 地 址 放 到 URL 队列 中 。 

(4) 从 URL 队列 中 读 取 新 的 URL， 并 依据 新 的 URL 扑 取 网 页 ， 同 时 从 新 网 页 中 获取 
新 URL， 并 重复 上 述 的 怜 取 过 程 。 

(5) 当 满 足 怜 虫 系统 设置 的 停止 条 件 时 停止 疏 取 。 在 编写 聆 虫 的 时 候 一 般 会 设置 相应 
的 停止 条 件 ， 如 果 没 有 设置 停止 条 件 ， 疏 虫 会 一 直 怜 取 下 去 ， 直 到 无 法 获取 新 的 URL 地 址 
为 止 ， 若 设置 了 停止 条 件 ， 疏 虫 则 会 在 停止 条 件 满足 时 停止 叭 取 。 

根据 图 5-4 所 示 的 网 络 爬 虫 的 实现 原理 及 过 程 ， 这 里 指定 中 原 工学 院 新 闻 门 户 的 URL 
地 址 “http:/www.zut.edu.cn/index/xwdt.htm” 为 初始 的 URL。 


















疏 取 页 面 并 
获得 新 URL 


获取 初 
始 URL 






将 新 URL 放 
入 URL 队 列 











将 已 用 取 地 
址 放 到 已 让 
列表 中 


图 5-4 ”网 络 息 虫 的 实现 原理 及 过 程 








使 用 unvisited 队列 存储 待 候 取 URL 链接 的 集合 并 使 用 广度 优先 搜索 ， 使 用 visited 集 
合 存储 已 访问 过 的 URL 链接 。 


unvisited=deque () # 待 候 取 链接 的 列表 ， 使 用 广度 优先 搜索 
visited=set () # 已 访问 的 链接 集合 


在 数据 库 中 建立 两 个 table， 其 中 一 个 是 doc 表 ， 存 储 每 个 网 页 ID 和 URL 链接 。 


create table doc(id int primary key,link text) 











1 http://www.zut.edu.cn/index/xwdt.htm 

2 http://www.zut.edu.cn/info/1052/19838.htm 
3 http://www.zut.edu.cn/info/1052/19837.htm 
4 http://www.zut.edu.cn/info/1052/19836.htm 
5 http://www.zut.edu.cn/info/1052/19835.htm 
6 http://www.zut.edu.cn/info/1052/19834.htm 
7 http://www.zut.edu.cn/info/1052/19833.htm 


另 一 个 是 word 表 ， 即 倒 排 表 ， 存 储 词语 和 其 对 应 的 网 页 ID 的 list。 
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create table word (term Varchar (25) primary key,list text) 


如 果 一 个 词 在 某 个 网 页 中 出 现 多 次 ， 那么 list 中 这 个 网 页 的 序号 也 出 现 多 次 。list 最 后 
转换 成 一 个 字符 串 存 进 数 据 库 。 

例如 ， 词 “ 王 宗 敏 ” 出 现在 网 页 ID 为 12、35、88 号 的 网 页 里 ，12 号 页 面 1 次 ，35 
号 页 面 3 次 ，88 号 页 面 两 次 ， 它 的 list 应 为 [12.35.35.35.88.88]， 转 换 成 字符 串 "12 35 35 35 
88 88" 存 储 在 word 表 的 一 条 记录 中 ， 形 式 如 下 : 


























term list 
王 案 12 35 35 35 88 88 
校友 会 54 190 190 701 986 986 1024 





怜 取 中 原 工 学 院 新 闻 网 页 的 代码 如 下 : 


#search engine build-2.py 
import sys 

from collections import deque 
import urllib 

from urllib import request 
import re 

from bs4 import BeautifulSoup 
import lxml 

import sqlite3 

import jieba 


url='http://www.zut.edu.cn' # 入 口 
unvisited=deque () # 待 息 取 链接 的 集合 ， 使 用 广度 优先 搜索 
visited=set () # 已 访问 的 链接 集合 


unvisited.append(url) 


conn=sdqlite3 .connect ('viewsdu.db') 
c=conn.cursor() 
# 在 create table 之 前 先 drop table 是 因为 之 前 测试 的 时 候 已 经 建 过 table 了 ， 所 以 再 次 运 
# 行 代码 的 时 候 要 把 旧 的 table 删 了 重建 
c.execute('drop table doc') 
c.execute('create table doc(id int primary key,link text)') 
c.execute('drop table word') 
c.execute('create table word (term varchar (25) primary key,list text)') 
conn.commit () 
conn.close() 
DELmE CY 六 率 康 率 率 六 率 率 闪闪 玉 六 开 - 妇 合用 了 取 六 六 冰 玉 六 六 末 六 素来 六 六 率 闵 率 闵 六 六 六 闵 闲 六 1 ) 
cnt=0 
RE 人 开始 3277 ') 
while unvisited: 
url=unvisited.popleft () 
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| 上 有 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


visited.add (url) 
cnt+=1 


print (' 开 始 抓 取 第 ', cnt, ' 个 链接 : ', url) 


# 疏 取 网 页 内 容 

try: 
response=request .urlopen (url) 
content=response.read() .decode ('utf-8°') 


except: 

continue 
# 寻 找 下 一 个 可 息 的 链接 ， 因 为 搜索 范围 是 网 站 内 ， 所 以 对 链接 有 格式 要 求 ， 需 根据 具体 情况 而 定 
# 解 析 网 页 内 容 ， 可 能 有 几 种 情况 ， 这 也 是 根据 这 个 网 站 网 页 的 具体 情况 写 的 
soup=BeautifulSoup (content, 'lxml') 
all a=soup.find all('a',{'class':"c67214"}) ”本 页 面 所 有 的 新 闻 链接 <a> 
for a in all a: 

#print (a.attrs['href']) 

=a attralrhretrl # 网 址 

if re.match(r'http.+',x) :# 排 除 是 http 开头 ,而 不 是 http://www.zut.edu.cn 网 址 

if not re.match(r'http\:\/\/www\.zut\.edu\.cn\/.+',x): 


continue 
if re.match(r'\/info\/.+',x): #"/info/1046/20314.htm" 
x="'http://www.zut.edu.cn'+x 
elif re.match(r'info/.+',x): #"info/1046/20314.htm" 
x="'http://www.zut.edu.cn/'+x 
elif re.match(r'\.\.\/info/.+',x): #"../info/1046/20314.htm" 


x='http://www.zut.edu.cn'+x[2:] 
elif re.match(r'\.\.\/\.\.\/info/.+',x): #"../../info/1046/20314.htm" 
x='http://www.zut.edu.cn'+x[5:] 


#print (x) 
if(x not in visited) and(x not in unvisited): 
unvisited.append (x) 
a=soup.find('a',{'class':"Next"}) # 下 一 页 <a> 
if a!=None: 
x=a.attrs['href'] 网 址 


if re.match(r'xwdt\/.+',x): 
x="'http://www.zut.edu.cn/index/'+x 

else: 
x="'http://www.zut.edu.cn/index/xwdt/'+x 

if(x not in visited) and(x not in unvisited): 
unvisited.append (zx) 


以 上 代码 实现 要 息 取 的 网 址 队列 unvisited。 
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5.4.2 ”索引 模块 一 一 建立 倒 排 词 表 


解析 新 闻 网 页 内 容 ， 这 个 过 程 需要 根据 这 个 网 站 网 页 的 具体 情况 来 处 理 。 


soup=BeautifulSoup (content, 'lxml') 
title=soup.title 
article=soup.find('div',class ='c67215 content',id='vsb newscontent') 
author=soup.find('span',class ="authorstyle67215") 间作 者 
time=soup.find('span',class ="timestyle67215") 
if title==None and article==None and author==None: 
print (' 无 内 容 的 页 面 。') 
continue 
elif article==None and author==None: 
print (' 只 有 标题 。') 
title=title.text 
title=''.join(title.split()) 
article="'"' 
author="™ 
elif article==None: 
print (' 有 标题 有 作者 ， 缺 失 内 容 ') 
title=title.text 
title=''.join(title.split()) 
article="'" 
author=author.get text("",strip=True) 
author="'' .join(author.split()) 
elif author==None: 
print (' 有 标题 有 内 容 ， 缺 失 作 者 ' ) 
title=title.text 
title=''.join(title.split()) 
article=article.get text("",strip=True) 
article='' .join(article.split()) 
author="" 
Slses 
title=title.text 
title=''.join(title.split()) 
article=article.get text("",strip=True) 
article='' .join(article.split()) 
author=author .get text("",strip=True) 
author="'' .join(author.split()) 
print (' 网 页 标题 : ' ,title) 


提取 出 的 网 页 内 容 存 在 于 title、article、author 中 ， 对 它们 进行 中 文 分 词 ， 并 对 每 个 分 
出 的 词语 建立 倒 排 词 表 。 


seggen=jieba.cut for search (title) 
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| 恩 要 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


seglist=l1ist(seggen) 
seggen=jieba.cut for search (article) 
seglist+=1ist(seggen) 
seggen=jieba.cut for search (author) 
seglist+=list (seggen) 


# 数 据 存储 
conn=sqlite3.connect ("viewsdu.db") 
c=conn.cursor () 
c.execute('insert into doc values(?,?)', (cnt,url)) 
# 对 每 个 分 出 的 词语 建立 倒 排 词 表 
for word in seglist: 
#print (word) 
# 检 验 看 看 这 个 词语 是 否 已 存在 于 数据 库 
c.execute('select list from word where term=?', (word,)) 
result=c.fetchall () 
# 如 果 不 存在 
if len(result)==0: 
docliststr=str (cnt) 
c.execute('insert into word values(?,?)', (word,docliststr)) 


# 如 果 已 存在 

else: 
docliststr=result[0] [0] # 得 到 字符 串 
docliststr+=' '+str(cnt) 


c.execute('update word set list=? where term=?', (docliststr,word)) 
conn.commit () 
conn.close() 
print (' 词 表 建 立 完毕 !! ') 


以 上 代码 只 需 运 行 一 次 即 可 ， 搜 索引 擎 所 需 的 数据 库 已 经 建 好 。 运 行 上 述 代码 出 现 如 


下 结果 : 


开始 抓 取 第 110 个 链接 : http://www.zut.edu.cn/info/1041/20191.htm 
网 页 标题 : 我 校 2017 年 学 生 奖 助 项 目 评审 工作 完成 资助 育 人 成 效 显著 -中 原 工 学 院 
开始 抓 取 第 111 个 链接 : http://www.zut.edu.cn/info/1041/20190.htm 
网 页 标题 : ”我 校 教师 李 慕 杰 、 王 学 鹏 参加 中 国 致 公 党 河南 省 第 一 次 代表 大 会 -中 原 工 学 院 
开始 抓 取 第 112 个 链接 : http://www.zut.edu.cn/info/1041/20187.htm 
网 页 标题 : ”我 校 与 励 展 企业 开展 校 企 合作 -中 原 工 学 院 

开始 抓 取 第 113 个 链接 : http://www.zut.edu.cn/info/1041/20184.htm 
网 页 标题 : ”平顶山 学 院 李 培 副 校长 一 行 来 我 校 考察 交流 -中 原 工学 院 

开始 抓 取 第 114 个 链接 : http://www.zut.edu.cn/info/1041/20179.htm 
网 页 标题 : ”我 校 学 生 在 工程 造价 技能 大 赛 中 获 佳绩 -中 原 工学 院 

开始 抓 取 第 115 个 链接 : http://www.zut.edu.cn/info/1041/20178.htm 
网 页 标题 我 校 召开 2018 届 毕 业 生 就 业 工 作 会 议 - 中 原 工学 院 
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当 需 要 搜索 的 时 候 执行 search_engine usepy， 完 成 网 页 排名 和 搜索 功能 。 
网 页 排名 采用 TF/IDF 统计 。TF/IDF 是 一 种 用 于 信息 检索 与 数据 挖掘 。 ”视频 讲解 






































的 常用 加 权 技 术 。TF/IDF 统计 用 于 评估 一 词 对 于 一 个 文件 集 或 一 个 语料库 中 的 一 份 文件 的 
重要 程度 。TF 的 意思 是 词 频 (Term Frequency)，IDF 的 意思 是 逆 文 本 频率 指数 (Inverse 
Document Frequency)。TF 表示 词 条 t 在 文档 d 中 出 现 的 频率 。IDF 的 主要 思想 是 : 如 果 包 
含 词 条 t 的 文档 越 少 ， 则 词 条 t 的 IDF 越 大 ， 说 明 词 条 t 具有 很 好 的 类 别 区 分 能 














词 条 t+ 的 IDEF 计算 公式 如 下 : 
idf= log(N/df) 


其 中 ，N 是 文档 总 数 ，df 是 包含 词 条 t 的 文档 数量 。 


在 本 程序 中 二 {文档 号 : 出 现 次 数 } 存 储 的 是 某 个 词 在 文档 中 出 现 的 次 数 。 例 如 王 宗 敏 





的 垃 {12:1，35:3，88:2} 即 词 “ 王 宗 敏 ”出 现在 网 页 ID 为 12、35、88 号 的 网 页 里 ，12 号 
页 面 1 次 ，35 号 页 面 3 次 ，88 号 页 面 两 次 。 


score={ 文 档 号 :文档 得 分 } 用 于 存储 命中 《〈 搜 到 ) 文档 的 排名 得 分 。 


#search engine use.py 

import re 

import urllib 

from urllib import request 

from collections import deque 
from bs4 import BeautifulSoup 
import lxml 

import sqlite3 

import jieba 

import math 

conn=sqlite3 .connect ("viewsdu.db") 
c=conn.cursor() 

c.execute('select count (*) from doc') 


N=1+c. fetchall () [0] [0] # 文 档 总 数 

target=input (' 请 输入 搜索 词 :' ) 

seggen=jieba.cut for search (target) # 将 搜索 内 容 分 词 

score={} # 字 典 ， 用 于 存储 “文档 号 : 文档 得 分 ” 


for word in seggen: 
Print (' 得 到 查询 词 : ' ,word) 
tf={} # 文 档 号 : 次 数 {12: 1，35: 3，88: 2} 
c.execute('select list from word where term=?', (word,)) 
result=c.fetchall () 
if len(result)>0: 
doclist=result[0] [0] # 字 符 串 “12 35 35 35 88 88” 
doclist=doclist.split(' ') 
doclist=[linE(x Tor rz in doclistl tl 2 OD SYSSOAR SS SS 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


# 把 字符 串 转换 成 元 素 为 int 的 1ist[12, 35, 88] 
df=len (set (doclist) ) # 当 前 word 对 应 的 df 数 ， 注 意 set 集合 实现 去 掉 重 复 项 
idf=math.1log (N/df) 间 计 算出 IDF 
Drintt "idEs GE 
for num in doclist: # 计 算 词 频 TFE， 即 在 某 文档 中 出 现 的 次 数 
if num in tf: 
tf[num]=tf[num]+1 
else: 
tf[num]=1 
#TF 统计 结束 ， 现 在 开始 计算 score 
for num in tf: 
if num in score: 
# 如 果 该 num 文档 已 经 有 分 数 了 ， 则 累加 
score [num]=score [num]+tf[num]*idf 
SLS 
score[num]=tf [num]*idf 


sortedlist=sorted (score.items (), key=lambda d:d[1],reverse=True) 


# 对 score 字典 按 字典 的 值 排 序 


#print (' 得 分 列表 '，, sortedlist) 
cnt=0 
for num,docscore in sortedlist: 


cnt=cnt+1 
c.execute('select link from doc where id=?', (num,)) 
# 按 照 TD 获取 文档 的 连接 (网 址 》 
url=c.fetchall () [0] [0] 
print (url ，' 得 分 : ' ,docscore) # 输 出 网 址 和 对 应 得 分 
世 
Fresponse=request.urlopen (url) 
content=response.read() .decode ('utf-8') # 可 以 输出 网 页 内 容 
except: 
print ('oops.. . 读 取 网 页 出 错 ') 
continue 
# 解 析 网 页 输出 标题 
soup=BeautifulSoup (content, 'lxml') 
title=soup.title 
if title==None: 
print('No title.') 
SSeS 
title=title.text 
print (title) 
TE GNAES20E # 超 过 20 条 则 结束 ， 即 输出 前 20 条 


break 


if cnt==0: 
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print (' 无 搜索 结果 ') 
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当 运 行 search_engine usepy 时 出 现 如 下 提示 : 
请 输入 搜索 词 : 王 宗 敏 


Building prefix dict from the default dictionary ... 





Loading model from cache C:\Users\xmj\AppData\Local\Temp\jieba.cache 


Loading model cost 0.961 seconds. 

Prefix dict has been built succesfully. 

得 到 查询 词 : 王 宗 敏 

idf: 3.337509562404897 

http://www.zut.edu.cn/info/1041/20120.htm 得 分 : 13.350038249619589 
王 宗 敏 校长 一 行 参 加 深圳 校友 会 年 会 并 走访 合作 企业 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/20435.htm 得 分 : 13.350038249619589 
中 国 工程 院 张 彦 仲 院士 莅临 我 校 指导 工作 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19775.htm 得 分 : 10.012528687214692 
我 校 河 南 省 功能 性 纺织 材料 重点 实验 室 接受 现场 评估 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19756.htm 得 分 : 10.012528687214692 
王 宗 敏 校长 召开 会 议 推进 “十 三 五 ”规划 “ 八 项 工程 ”建设 -中 原 工学 院 
http://www.zut.edu.cn/info/1041/19726.htm 得 分 : 10.012528687214692 
我 校 2017 级 新 生 开学 典礼 隆重 举行 -= 中原 工学 院 
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6.1 程序 功能 介绍 


使 用 网 络 疏 虫 技术 疏 取 百度 图 片 某 主题 的 相关 图 片 ， 并 且 能 按 某 一 关 视频 讲解 
键 字 搜索 图 片 下 载 到 本 地 指定 的 文件 夹 中 。 本 程序 主要 完成 下 载 功 能 ， 不 需要 设计 图 形 化 
界面 。 在 运行 时 出 现 如 下 提示 : 

Please input you want search: 

让 用 户 输入 关键 词 , 例如 输入 “ 夏 敏捷 ”, 然后 按 回 车 键 , 则 看 到 如 图 6-1 所 示 的 效果 。 

a RESTART: I:\ (第 14) 更 学 项 目 案例 开发 《Python 课程 设计 案例 ) \ 百 度 图 片 下 载 00. py 














图 6-1 疏 取 百度 图 片 运行 效果 示意 图 
从 图 6-1 可 以 看 到 开始 下 载 了 。 


6.2 ”程序 设计 的 思路 


一 般 来 说 ， 制 作 一 个 候 虫 需要 分 以 下 几 个 步 又 : 
(1) 分 析 需 求 ， 这 里 的 需求 就 是 候 取 网 页 图 片 。 
(2) 分 析 网 页 源 代码 和 网 页 结构 ， 配 合 F12 键 查看 网 页 源 代码 。 
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(3) 编写 正则 表达 式 或 者 XPath 表达 式 。 
(4) 正式 编写 Python 怜 虫 代码 。 
本 章 按照 该 步骤 实现 按 关 键 词 疏 取 百度 图 片 。 


6.3 关键 技术 
6.3.1 ”图片 文件 下 载 到 本 地 


@ 使 用 requesturlretrieve0 函 数 

如 果 要 把 对 应 图 片 文件 下 载 到 本 地 ， 可 以 使 用 urlretrieveO 函 数 。 

from urllib import request 

request .urlretrieve ("http://www.zzti.edu.cn/ mediafile/index/2017/06/24 

/1qjdyc7vq5.jpg", "aaa.jpg") 

上 例 就 可 以 把 网 络 上 中 原 工学 院 的 图 片 资源 1qjdyc7vq5.jpg 下 载 到 本 地 ， 生 成 aaajpg 
图 片 文件 。 

@ 使 用 Python 的 文件 操作 函数 write0 写 人 文件 


from urllib import request 








import urllib 

url="' http://www.zzti.edu.cn/ mediafile/index/2017/06/24/1q]jdyc7vq5.jpg 

urll=urllib. request .Request (url) #Request () 函数 将 url 添加 到 头 部 ， 
# 模 拟 浏览 器 访问 

page=urllib.request.urlopen (url1) .read()  # 将 url 页 面 的 源 代码 保存 成 字符 串 

#open () .write () 方 法 原始 且 有 效 

open('C:\\aaa.jpg', 'wb') .write (page) # 写 入 aaa.jpg 文件 中 


6.3.2 ”把 取 指 定 网 页 中 的 图 片 


首先 用 urllib 库 来 模拟 浏览 器 访问 网 站 的 行为 ， 由 给 定 的 网 站 链接 (url) 得 到 对 应 网 
页 的 源 代 码 (html 标签 )。 其 中 ， 源 代码 以 字符 串 的 形式 返回 。 

然后 用 正则 表达 式 re 库 在 字符 串 〈 网 页 源 代码 ) 中 匹配 表示 图 片 链接 的 小 字符 串 ， 返 
回 一 个 列表 。 

最 后 循环 列表 ， 根 据 图 片 链接 将 图 片 保存 到 本 地 。 

urllib 库 的 使 用 在 Python2.x 和 Python3.x 中 的 差别 很 大 ， 本 案例 以 Python3.x 为 例 。 














第 一 个 简单 的 仆 取 图 片 程序 ， 使 用 Python3.x 和 urllib 与 re 库 


import urllib.request 
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| 中 县 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


import re # 正 则 表达 式 
def getHtmlCode (url) : ”# 该 方法 传 入 url， 返 回 url 的 html 的 源 代码 
headers={ 
'User-Agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRAS58N) 
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Mobile 
Safari/537.36"' 
} 
urll=urllib.request.Request (url, headers=headers) 
#Request () 函数 将 url 添加 到 头 部 ， 模 拟 浏览 器 访问 
page=urllib.request.urlopen (url1) .read () 
# 将 url 页 面 的 源 代码 保存 成 字符 串 
page=page .decode ('UTF-8') ，# 字 符 串 转 码 
return page 


def getImg (page) :# 该 方法 传 入 html 的 源 代码 ， 经 过 截取 其 中 的 img 标签 ， 将 图 片 保存 到 本 机 
imgList=re.findall (r' (http: [^\s]*? (jpglpnglgif))"',page) 


X=0 
for imgUrl in imgList: # 列 表 循 环 
EYE 
print (' 正 在 下 载 : ss'simgUrl[0]) 
#urlretrieve (url, local) 方 法 根据 图 片 的 url 将 图 片 保存 到 本 机 
urllib.request.urlretrieve (imgUr1l1[0],"E:/img/sd.jpg'sx) 
x+=1 
except: 
continue 
if _ name =='_ main _': 
url="'http://blog.csdn.net/qq 32166627/article/details/60345731' 


# 指 定 网 址 页 面 
page=getHtmlCode (url) 
getImg (page) 
对 于 findall( 正 则 表达 式 , 代 表 页 面 源 代码 的 str) 函 数 ， 在 字符 串 中 按照 正则 表达 式 截取 
其 中 的 子 字符 串 ，findall0 返 回 一 个 列表 ,列表 中 的 元 素 是 一 个 个 元 组 ,元 组 的 第 1 个 元 素 
是 图 片 的 url， 第 2 个 元 素 是 url 的 扩展 名 ， 列 表 形 式 如 下 : 
[('http://avatar.csdn.net/4/E/B/1 qq 32166627.jpg'"，'jJpg'")， 


('http://avatar.csdn.net/1/1/4/2 fly yr.jpg', 'jpg'), 
('http://avatar.csdn.net/8/1/3/2 u013007900.jpg', 'jpg'), 





('http://avatar.csdn.net/1/B/B/1 csdn.jpg', 'jpg')] 


上 述 代码 在 找 图 片 的 url 时 用 的 是 re (正则 表达 式 )。re 用 得 好 会 有 奇效 ， 用 得 不 好 效 
果 极 差 。 
既然 得 到 了 网 页 的 源 代码 ， 就 可 以 根据 标签 的 名 称 得 到 其 中 的 内 容 。 
1 于 正则 表达 式 难 以 和 掌握， 这 里 用 一 个 第 三 方 库 BeautifulSoup， 它 可 以 根据 标签 
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的 名 称 对 网 页 内 容 进 行 截取 。BeautifulSoup4 的 中 文 文档 请 参见 页 面 “http://beautifulsoup. 
readthedocs.io/zh CN/latest/”。 


6.3.3 ”BeautifulSoup 库 概述 


BeautifulSoup 英 文 原意 是 美丽 的 蝴蝶 〉 是 一 个 Python 处 理 HTML/XML 的 函数 库 ， 
是 Python 内 置 的 网 页 分 析 工 具 ， 用 来 快速 地 转换 被 抓 取 的 网 页 。 它 产生 一 个 转换 后 DOM 
树 ， 尽 可 能 和 原文 档 内 容 的 含义 一 致 ， 这 种 措施 通常 能 够 满足 用 户 搜集 数据 的 需求 。 

BeautifulSoup 提供 了 一 些 简单 的 方法 以 及 类 Python 语法 来 查找 、 定 位 、 修 改 一 棵 转换 
后 DOM 树 。BeautifulSoup 自动 将 送 进来 的 文档 转换 为 Unicode 编码 ， 而 且 在 输出 的 时 候 
转换 为 UTF-8。BeautifulSoup 可 以 找 出 “所 有 的 链接 <a> ”， 或 者 “所 有 class 是 xxx 的 链 
接 <a>”， 再 或 者 是 “所 有 匹配 .cn 的 链接 url”。 

@ BeautifulSoup 的 安装 

使 用 pip 直接 安装 BeautifulSoup4: 


pip3 install beautifulsoup4 


推荐 在 现在 的 项 目 中 使 用 BeautifulSoup4 (bs4)， 导 入 时 需要 import bs4。 

四 BeautifulSoup 的 基本 使 用 方式 

下 面 使 用 一 段 代码 演示 BeautifulSoup 的 基本 使 用 方式 。 

from bs4 import BeautifulSoup 

#qdoc 可 以 是 一 个 HTML 内 容 的 字符 串 ， 本 例 是 列表 ， 需 要 转换 成 字符 串 

doc=['<html><head><title> The story of Monkey </title></head>', 
'<body><p id="firstpara" align="center">This is one paragraph </p>', 
'<p id="secondpara" align="center">This is two paragraph </p>', 
'</html>'] 


soup=Beautifulsoup(''.join(doc), "html.parser") 


# 提 供 字 符 串 信息 ，' ' .join (doc) 将 其 合并 为 字符 串 





print (soup.prettify()) 

在 使 用 时 BeautifulSoup 首先 要 导入 bs4 库 : 

from bs4 import BeautifulSoup 

创建 BeautifulSoup 对 象 : 

soup=BeautifulSoup (html) 

另外 ， 还 可 以 用 本 地 HTML 文件 来 创建 对 象 ， 例 如 : 

soup=Beautifulsoup (open ('index.html') ，"html.parser")## 提 供 本 地 HTML 文件 


上 面 的 代码 是 将 本 地 index.html 文件 打开 ， 用 它 来 创建 soup 对 象 。 
用 户 也 可 以 使 用 网 址 URL 获取 HIML 文件 ， 例 如 : 


from urllib import request 
response=request.urlopen ("http://www.baidu.com") 
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也 二 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
html=response.read() 
html=html .decode ("utf-8") #decode () 用 于 将 网 页 的 信息 进行 解码 ， 否 则 会 产生 乱码 
soup=Beautifulsoup (html, "html.parser") # 远 程 网 站 上 的 HTML 文件 
程序 段 最 后 格式 化 输出 BeautifulSoup 对 象 的 内 容 。 
print (soup.prettify()) 
运行 结果 如 下 : 
<html> 
<head> 

<title> The story of Monkey </title> 
</head> 
<body> 

<p align="center" id="firstpara"> 

This is one paragraph 

</p> 

<p align="center" id="secondpara"> 

This is two paragraph 

</p> 
</body> 
</html> 


以 上 便 是 输出 结果 ， 格 式 化 打印 出 了 BeautifulSoup 对 象 (DOM 树 ) 的 内 容 。 

BeautifulSoup 将 复杂 的 HIML 文档 转换 成 一 个 复杂 的 树 形 结构 ， 其 中 每 个 结 点 都 是 
Python 对 象 。 所 有 对 象 可 以 归纳 为 4 种 ， 即 Tag、NavigableString、BeautifulSoup 前面 例 
子 中 已 经 使 用 过 )、Comment。 

1) Tag 对 象 

Tag 是 什么 ? 通俗 点 讲 就 是 HTML 中 的 一 个 个 标签 ， 例 如 : 

<title> The story of Monkey </title> 

<a href="http://example.com/elsie" id="linkl">Elsie</a> 

上 面 的 <title>、<a> 等 HTML 标签 加 上 里 面包 括 的 内 容 就 是 Tag， 下面 用 BeautifulSoup 
来 获取 Tags。 


print (soup.title) 
print (soup.head) 


输出 如 下 : 


<title> The story of Monkey </title> 
<head><title> The story of Monkey </title></head> 


用 户 可 以 用 BeautifulSoup 对 象 soup 加 标签 名 轻松 地 获取 这 些 标 签 的 内 容 , 但 应 注意 ， 
它 查 找 的 是 所 有 内 容 中 第 1 个 符合 要 求 的 标签 ， 对 于 查询 所 有 的 标签 ， 将 在 后 面 进行 介绍 。 
可 以 验证 一 下 这 些 对 象 的 类 型 。 


print (type (soup.title)) # 输 出 : <class 'bs4.element.Tag'> 
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对 于 Tag， 它 有 两 个 重要 的 属性 一 一 name 和 attrs， 下 面 分 别 来 感受 一 下 。 


print (soup.name) # 输 出 : [document] 
print (soup.head.name) # 输 出 : head 


soup 对 象 本 身 比 较 特殊 ， 它 的 name 即 为 [document]， 对 于 其 他 内 部 标签 , 输出 的 值 便 
为 标签 本 身 的 名 称 。 

print (soup.p.attrs) PD iq: "firstpara'r "align'y "center’i 

在 这 里 把 p 标签 的 所 有 属性 打印 输出 ， 得 到 的 类 型 是 一 个 字典 。 

如 果 想 要 单独 获取 某 个 属性 ， 例 如 获取 它 的 ID 可 以 这 样 做 : 

print (soup.p['id']) # 输 出 : firstpara 

另外 还 可 以 利用 get0 方 法 传 入 属性 的 名 称 ， 二 者 是 等 价 的 。 

print (soup.p.get ('id')) # 输 出 : firstpara 

用 户 可 以 对 这 些 属性 和 内 容 等 进行 修改 ， 例 如 : 

soup.p['class']="newClass" 

另外 还 可 以 对 这 个 属性 进行 删除 ， 例 如 : 


del soup.p['class'] 








2) NavigableString 对 象 
既然 已 经 得 到 了 标签 的 内 容 ， 要 想 获取 标签 内 部 的 文字 怎么 办 呢 ? 很 简单 ， 用 .string 
即 可 ， 例 如 : 


soup.title.string 


这 样 就 轻松 获取 到 了 标签 里 面 的 内 容 ， 如 果 用 正则 表达 式 则 麻烦 得 多 。 

3) BeautifulSoup 对 象 

BeautifulSoup 对 象 表示 的 是 一 个 文档 的 全 部 内 容 。 大 部 分 时 候 可 以 把 它 当 作 Tag 对 象 ， 
它 是 一 个 特殊 的 Tag， 下 面 的 代码 可 以 分 别 获取 它 的 类 型 、 名 称 以 及 属性 。 





Print (type(soup) ) # 输 出 : <class 'bs4.BeautifulSoup'> 
print (soup.name) # 输 出 : [document] 
print (soup.attrs) # 输 出 空 字典 :，{} 


4) Comment 对 象 
Comment (注释 ) 对 象 是 一 个 特殊 类 型 的 NavigableString 对 象 ， 其 内 容 不 包括 注释 符 
号 ， 如 果 不 好 好 地 处 理 它 ， 可 能 会 对 文本 处 理 造成 意 想不到 的 麻烦 。 


6.3.4 用 BeautifulSoup 库 操作 解析 HTML 文档 树 
@ 遍历 文档 树 
1) 用 .content 属性 和 .children 属性 获取 直接 子 结 点 
Tag 的 .content 属性 可 以 将 Tag 的 子 结 点 以 列表 的 方式 输出 。 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


print (soup.body.contents) 
输出 : 


[<p align="center" id="firstpara">This is one paragraph</p>, 
<p align="center" id="secondpara">This is two paragraph</p>] 


此 时 输出 为 列表 ， 可 以 用 列表 索引 来 获取 它 的 某 一 个 元 素 。 

print (soup.body.contents[0]) # 获 取 第 1 个 <p> 

输出 : 

<p align="center" id="firstpara">This is one paragraph </p> 


-children 属性 返回 的 不 是 一 个 list， 它 是 一 个 list 生成 器 对 象 ， 不 过 用 户 可 以 通过 遍历 
获取 所 有 子 结 点 。 


for child in soup.body.children: 
print (child) 


输出 : 


<p align="center" id="firstpara"> This is one paragraph </p> 





<p align="center" id="secondpara">This is two paragraph </p> 


2) 用 .descendants 属性 获取 所 有 子孙 结 点 

.contents 和 .children 属性 仅 包含 Tag 的 直接 子 结 点 ，.descendants 属性 可 以 对 所 有 Tag 
的 子孙 结 点 进行 递归 循环 ， 和 .children 类 似 ， 用 户 也 需要 遍历 获取 其 中 的 内 容 。 

for child in soup.descendants : 

print (child) 

可 以 发 现 ， 所 有 的 结 点 都 被 打印 出 来 ， 先 是 最 外 层 的 HTML 标签 ， 其 次 从 head 标签 
一 个 个 剥离 ， 依 此 类 推 。 

3) 结 点 内 容 

如 果 一 个 标签 里 面 没 有 标签 了 ， 那 么 .string 就 会 返回 标签 里 面 的 内 容 。 如 果 标 签 里 面 
只 有 唯一 的 一 个 标签 ， 那 么 .string 也 会 返回 最 里 面 标签 的 内 容 。 

如 果 Tag 包含 了 多 个 子 标签 结 点 ，Tag 将 无 法 确定 .string 方法 应 该 调用 哪个 子 标 签 结 
点 的 内 容 ，.string 的 输出 结果 是 None。 





print (soup. title.string) # 输 出 <title> 标 签 里 面 的 内 容 

print (soup. body.string) #<body> 标 签 包含 了 多 个 子 结 点 ， 所 以 输出 None 
输出 : 

The story of Monkey 

None 

4) 父 结 点 


.parent 属性 用 于 获取 父 结 点 。 
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p=soup.title 
print (p.parent .name) # 输 出 父 结 点 名 Head 


输出 : 

Head 

以 上 是 遍历 文档 树 的 基本 用 法 。 

@ 搜索 文档 树 

1) find all(name, attrs, recursive, text, **kwargs) 

find_all0 方 法 搜索 当前 Tag 的 所 有 Tag 子 结 点 ， 并 判断 是 否 符合 过 滤器 的 条 件 ， 其 参 
数 如 下 。 

(1) name 参数 : 可 以 查找 所 有 名 字 为 name 的 标签 。 

print (soup.find all('p')) # 输 出 所 有 <p> 标 签 

[<p align="center" id="firstpara">This is one paragraph</p>, <p align= 

"center" id="secondpara">This is two paragraph</p>] 

如 果 name 参数 传 入 正则 表达 式 作 为 参数 ，BeautifulSoup 会 通过 正则 表达 式 的 match() 
来 匹配 内 容 。 下 面 的 例子 找 出 所 有 以 h 开头 的 标签 。 

for tag in soup.find all(re.compile("^h")) : 

print (tag.name, end=" ") #html head 


输出 : 
html head 


这 表示 < html > 和 < head > 标签 都 被 找到 。 

(2) attrs 参数 ， 按照 tag 标签 属性 值 检 索 ， 需 要 列 出 属性 名 和 值 ， 采 用 字典 形式 。 

soup.find all('p',attrs={'id':"firstpara"}) 或 者 soup.find alll('p', {'id': 

"firstpara"}) 

它们 都 是 查找 属性 值 id 是 "firstpara" 的 <p> 标 签 。 

当然 也 可 以 采用 关键 字形 式 “soup.find_ all(p', {id="firstpara"})”。 

(3 ) recursive 参数 : 在 调用 Tag 的 find_all0 方 法 时 BeautifulSoup 会 检索 当前 Tag 的 所 
有 子孙 结 点 ， 如 果 只 想 搜索 Tag 的 直接 子 结 点 ， 可 以 使 用 recursive=False。 

(4) text 参数 : 通过 text 参数 可 以 搜索 文档 中 的 字符 串 内容 。 

print (soup.find all (text=re.compile ("paragraph") ) )#re.compile() 正则 表达 式 

输出 和 

['This is one paragraph', 'This is two paragraph'] 

re.compile("paragraph") 为 正则 表达 式 ， 表 示 所 有 含有 “paragraph” 的 字符 串 都 匹配 。 

(5) limit 参数 ，find_all0 方 法 返回 全 部 的 搜索 结构 ， 如 果 文 档 树 很 大 ， 那 么 搜索 会 很 


慢 。 如 果 用 户 不 需要 全 部 结果 ， 可 以 使 用 limit 参数 限制 返回 结果 的 数量 ， 当 搜索 到 的 结果 
数量 达到 limit 的 限制 时 就 停止 搜索 返回 结果 。 
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文档 树 中 有 两 个 Tag 符合 搜索 条 件 ， 但 结果 只 返回 了 1 个 ， 因 为 限制 了 返回 数量 。 

soup.find all("p", limit=1) 

输出 : 

[<p align="center" id="firstpara">This is one paragraph</p>] 

2) find(name, attrs, recursive, text) 

它 与 find_all0 方 法 唯一 的 区 别 是 find_all0 方 法 返回 全 部 结果 的 列表 ， 而 find() 方 法 返 
回 找到 的 第 1 个 结果 。 

加 用 CSS 选择 器 饰 选 元 素 

在 写 CSS 时 标签 名 不 加 任何 修饰 ， 类 名 前 加 点 ，ID 名 前 加 #。 在 这 里 也 可 以 利用 类 似 
的 方法 来 筛选 元 素 ， 用 到 的 方法 是 soup.select()， 返 回 类 型 是 列表 。 

(1) 通过 标签 名 查找 : 








soup.select ('title') ## 选 取 <tit1le> 元 素 
(2) 通过 类 名 查找 : 
soup.select ('.firstpara') ## 选 取 class 是 firstpara 的 元 素 


soup.select one(".firstpara")  # 查 找 class 是 firstpara 的 第 1 个 元 素 

(3) 通过 id 名 查找 : 

soup.select ('#firstpara') # 选 取 id 是 firstpara 的 元 素 

以 上 的 select0 方 法 返回 的 结果 都 是 列表 形式 , 可 以 用 遍历 形式 输出 ,然后 用 get_text() 
方法 或 text 属性 来 获取 它 的 内 容 。 


soup=Beautifulsoup (html, 'html.parser') 
print type(soup.select('div')) 


print (soup.select ('div') [0] .get text()) # 输 出 首 个 <div> 元 素 的 内 容 
for title in soup.select('title') : 
print (title. text) # 输 出 所 有 <div> 元 素 的 内 容 


处 理 网 页 需要 对 HTML 有 一 定 的 了 解 ，BeautifulSoup 库 是 一 个 非常 完备 的 HTML 解 
析 函 数 库 ， 有 了 BeautifulSoup 库 的 知识 ， 就 可 以 进行 网 络 爬 虫 实战 了 。 
from bs4 import BeautifulSoup 
def getHtmlCode (url) : # 该 方法 传 入 url， 返 回 url 的 html 的 源 代码 
headers={ 
'User-Agent': 'MMozilla/5.0(Windows NT 6.1; WOW64; rv:31.0) Gecko/ 
20100101 Firefox/31.0"' 
i 
urll=urllib.request.Request (url, headers=headers) 
#Request () 函数 将 url 添加 到 头 部 ， 模 拟 浏览 器 访问 
page=urllib.request .urlopen (url1) .read () 
坦 将 url 页 面 的 源 代码 保存 成 字符 串 
page=page.decode ('UTF-8') ，# 字 符 串 转 码 
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return page 


def getImg (page, localPath): 


# 该 方法 传 入 html 的 源 代码 ， 截 取 其 中 的 img 标签 ， 将 图 片 保存 到 本 机 
soup=BeautifulSoup (page, 'html .parser') # 按 照 html 格式 解析 页 面 


imgList=soup.find all('img') # 返 回 包含 所 有 img 标签 的 列表 
> 
for imgUrl in imgList: # 列 表 循环 


print (' 正 在 下 载 : $s'%imgUrl.get ('src')) 
#urlretrieve (url, local) 方 法 根据 图 片 的 url 将 图 片 保存 到 本 机 
Urllib.request.urlretrieve (imgUrl.get ('src'),1localPath+'%d.jpg'%x) 
X+=1 
if _ name =='_ main _': 

url="'http://www.zhangzishi.cc/20160928gx.html' 

localPath='E:/img/"' 

page=getHtmlCode (url) 

getImg (page, localPath) 


可 见 使 用 BeautifulSoup 能 比 使 用 正则 表达 式 更 简单 地 找到 所 有 img 标签 。 


6.3.5 _ requests 库 的 使 用 


requests 库 和 urllib 库 的 作用 相似 且 使 用 方法 基本 一 致 ,都 是 根据 HITP 协议 操作 各 种 
消息 和 页 面 ， 但 使 用 requests 库 比 使 用 urllib 库 更 简单 些 。 

@@ requests 库 的 安装 

使 用 pip 直接 安装 requests: 

pip3 install requests 

安装 后 进入 Python 导入 模块 测试 是 否 安 装 成 功 。 

import requests 

没有 出 错 即 安装 成 功 。 

对 于 requests 库 的 使 用 ， 请 读者 参阅 “http://cn.python-requests.org/zh_CN/latest/”。 

四 发 送 请 求 

发 送 请 求 很 简单 ， 首 先 要 导入 requests 模块 : 

>>>import requests 


接 下 来 获取 一 个 网 页 ， 例 如 中 原 工 学 院 的 首页 : 


>>>r=requests.get ('http://www.zut.edu.cn') 


之 后 就 可 以 使 用 这 个 的 各 种 方法 和 函数 了 。 
另外 ，HTTP 请 求 还 有 很 多 类 型 ， 例 如 POST、PUT、DELETE、HEAD、OPTIONS， 
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可 以 用 同样 的 方式 实现 : 


>>> r=requests.post ("http://httpbin.org/post") 

















>>> r=requests.head("http://httpbin.org/get") 

@ 在 URL 中 传递 参数 

有 时 候 需 要 在 URL 中 传递 参数 , 比如 在 采集 百度 搜索 结果 时 , 对 于 wd 参数 (搜索 词 ) 
和 m 参数 〈 搜 索 结 果 数 量 )， 可 以 通过 字符 串 连 接 的 形式 手工 组 成 URL， 但 requests 提供 
了 一 种 简单 的 方法 : 

>>> payload={'wd' : ' 夏 敏捷 '，'rn': '100'} 

>>> r=requests.get ("http://www.baidu.com/s", params=payload) 

>>> print(r.url) 


结果 如 下 : 
http://www.baidu.com/s?wd=%E5%A4%8F%E6%95%8F%E6%8D%SB7&rn=100 


上 面 wd= 的 乱码 就 是 “ 夏 敏 捷 ” 的 URL 转 码 形式 。 


了 POST 参数 请 求 例子 如 下 : 

requests.post ('http://www.itwhy.org/wp-comments-post.php', data= 
{'comment': ' 测 试 PoST'}) #POST 参数 

@ 获取 响应 内 容 


>>> r=requests.get('http://www.baidu.com') # 返 回 一 个 Response 对 象 上 
2ZDPOPRELBX 


在 使 用 requests() 方 法 后 会 返回 一 个 Response 对 象 ， 其 存储 了 服务 器 响应 的 内 容 ， 如 
上 实例 中 已 经 提 到 的 rtext。 

用 户 可 以 通过 rtext 来 获取 网 页 的 内 容 。 

结果 如 下 : 


"<!DOCTYPE html>\r\n<!--STATUS OK--><html> <head><meta http-equiv=content- 
type content=text/html;charset=utf-8><meta http-equiv=X-URA-Compatible 
content=IE=Edge><meta content=always name=referrer>..."' 


另外 ， 还 可 以 通过 rcontent 来 获取 页 面 内 容 。 

>>> r.content 

Icontent 以 字 节 的 方式 去 显示 ， 所 以 在 IDLE 中 以 b 开头 。 
>>> r.encoding # 可 以 使 用 r.encoding 来 获取 网 页 编码 
结果 如 下 : 

"utf-8’ 


当 发 送 请 求 时 ，requests 会 根据 HTTP 头 部 来 获取 网 页 编码 ， 当 使 用 rtext 时 ，requests 
就 会 使 用 这 个 编码 。 当 然 ， 用 户 还 可 以 修改 requests 的 编码 形式 。 
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>>> r=requests.get('http://www.zhidaow.com') 
>>> r.encoding 

wt 

>>>r .encoding="'ISO-8859-1"' 


像 上 面 的 例子 ， 对 encoding 修改 后 直接 用 修改 后 的 编码 去 获取 网 页 内 容 。 

©@ JSON 

如 果 用 到 JSON， 就 要 引入 新 模块 ， 例 如 json 和 simplejson， 但 在 requests 中 已 经 有 了 
内 置 的 函数 rjson()。 这 里 以 查询 卫 的 API 为 例 : 


>>>r=requests.get ('http://ip.taobao.com/service/getIpInfo.php?ip= 
202.196.32577) 

>>> r.json() 

datas (reogion Gu MAlOO0O00M "county: xX Meity idre "AIO0LOO0"S 
'area':'', 'country': ' 中 国 ','country id': 'CN','isp': ' 教 育 网 '，'"area_ id': 
ye D2 G2 Ton Il sei 
LOOOZTY MOomEy dd Uris codsr OF 

>>>r.json()['data']['country'] 


' 中 国 ' 


@ 网 页 状态 码 
用 户 可 以 使 用 rstatus_code 来 检查 网 页 的 状态 码 。 


>>>r=requests.get ('http://www.mengtiankong.com') 





>>>r.status code 

200 

>>>r=requests.get ('http://www.mengtiankong.com/123123/') 
>>>r.status code 


404 
此 时 ， 能 正常 打开 网 页 的 返回 200， 不 能 正常 打开 的 返回 404。 
@ 响应 的 头 部 内 容 


用 户 可 以 通过 rheaders 来 获取 响应 的 头 部 内 容 。 


>>>r=requests.get ('http://www.zhidaow.com') 
>>> r.headers 


{ 
'content-encoding': 'gzip', 
'transfer-encoding': 'chunked', 
"content=type": text/html; charset=utf=8"s 


可 以 看 到 以 字典 的 形式 返回 了 全 部 内 容 ， 用 户 也 可 以 访问 部 分 内 容 。 


>>> r.headers['Content-Type'] 
'text/html; charset=utf-8" 
>>> r.headers.get ('content-type') 
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'text/html; charset=utf-8" 


全 设置 超时 时 间 

用 户 可 以 通过 timeout 属性 设置 超时 时 间 ， 一 旦 超过 这 个 时 间 还 没有 获得 响应 内 容 ， 
就 会 提示 错误 。 

>>> requests.get ('http://github.com', timeout=0.001) 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
requests.exceptions.Timeout: HTTPConnectionPool (host='github.com', 
Port=80) : Request timed out. (timeout=0.001) 


人 @ 代理 访问 
在 采集 时 为 避免 被 封 PP， 经 常会 使 用 代理 。requests 也 有 相应 的 proxies 属性 。 


import requests 

proxies={ 
sit ev 20 
hitosm CD/ LO LO L000 


} 
requests.get ("http://www.zhidaow.com", proxies=proxies) 


如 果 代 理 需 要 账户 和 密码 ， 则 需要 这 样 : 


proxies={ 
”bttp "http://userpassel0. 10.1.10:3128/", 
} 


@@ 请 求 关内 容 

请 求 头 内容 可 以 用 rrequestheaders 来 获取 。 

>>>Lr.request .headers 

{'Accept-Encoding': "identity，deflate，compress，gzip'， 

'Accept': '*/*', 'User-Agent': 'python-requests/1.2.3 CPython/2.7.3 Windows/XP'} 
图 自 定义 请 求 头 部 

伪装 请 求 头 部 是 聆 虫 采集 信息 时 经 常用 到 的 ， 用 户 可 以 用 这 个 方法 来 隐藏 自己 : 


>>>r=requests.get ('http://www.zhidaow.com') 
>>>print (r.request.headers['User-Agent']) # 输 出 python-requests/2.13.0 














>>>headers={'User-Agent': 'xmj'} 
>>>r=requests.get ('http://www.zhidaow.com', headers=headers) 

# 伪 装 的 请 求 头 部 
>>>print (r.request.headers['User-Agent'] ) # 输 出 xzmj， 避 免 被 反 息 虫 


再 例如 另 一 个 定制 header 的 例子 : 


import requests 
import json 
data={'some': "'data"'} 
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headers={'content-type': 'application/json', 
'User-Agent': 'Mozilla/5.0(X117 Ubuntu; Linux x86 64; rv:22.0) 
Gecko/20100101 Firefox/22.0'} 
r=requests.post('https://api.github.com/some/endpoint', data=data, 
headers=headers) 
print (r.text) 


下 面 用 requests 库 蔡 换 urllib 库 , 并 用 open().write() 方 法 蔡 换 掉 urllib.request.urlretrieve 
(url, localPath) 方 法 来 下 载 中原 工 学 院 主页 上 的 所 有 图 片 。 


使 用 requests、bs4 库 下 载 中 原 工学 院 主页 上 的 所 有 图 片 





import os 
import requests 
from bs4 import BeautifulSoup 
def getHtmlCode (url): # 该 方法 传 入 ur1， 返 回 url 的 html 的 源 代码 
headers={ 
'User-Agent': 'MMozilla/5.0(Windows NT 6.1; WOW64; rv:31.0) Gecko/ 
20100101 Firefox/31.0"' 
} 
r=requests.get (url,headers=headers) 


r.encoding='UTF-8"' # 指 定 网 页 解析 的 编码 格式 
page=r .text # 获 取 url 页 面 的 源 代码 字符 串 文本 


return page 


def getImg (page,1ocalPath) : 间 该 方法 传 入 html 的 源 代码 ， 截 取 其 中 的 img 标签 ， 将 图 
# 片 保存 到 本 机 
if not os.path.exists (localPath) : # 新 建文 件 夹 
os.mkdir (localPath) 
soup=BeautifulSoup (page, 'html .parser') # 按 照 html 格式 解析 页 面 
imgList=soup.find all('img') # 返 回 包含 所 有 img 标签 的 列表 
X=0 
for imgUrl in imgList: # 列 表 循 环 
try: 
print (' 正 在 下 载 : $s'%imgUrl.get('src')) 
if "http://" not in imgUrl.get('src'): # 不 是 绝对 路 径 http 开始 
m="'http://www.zut.edu.cn/'+imgUrl.get ('src') 
print (' 正 在 下 载 : $s' sm) 
ir=requests.get ('http://www.zut.edu.cn/'+imgUrl.get ('src')) 
ELSE 
ir=requests.get (imgUrl.get ('src')) 
# 用 write () 方 法 写 入 本 地 文件 中 
open (localPath+'%d.jpg'%x, 'wb') .write(ir.content) 
X+=1 


except: 


129 | 





| 本 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


continue 
if _ name =='_ main _': 
url=" http://www.zut.edu.cn/" 
localPath="'E:/img/" 
page=getHtmlCode (url) 
getImg (page, localPath) 


掌握 上 述 技术 后 先 疏 取 较 简单 的 搜狗 图 片 中 某 主题 的 图 片 。 

输入 搜狗 图 片 的 网 址 “http://pic.sogou.com/”， 进 入 壁纸 分 类 ， 然 后 按 F12 键 进 入 开发 
人 员 选 项 (编者 用 的 是 Google Chrome 浏览 器 )。 右 击 某 张 图 片 , 在 快捷 菜单 中 选择 “检查 ” 
命令 ， 结 果 如 图 6-2 所 示 。 
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图 6-2 网 页 代码 示意 图 


发 现 需要 的 图 片 是 在 img 标签 下 的 ， 于 是 先 试 着 用 Python 的 requests 提取 该 组 件 ， 进 
而 获取 img 的 src， 然 后 使 用 urllib.request.urlretrieve 逐个 下 载 图 片 ， 从 而 达到 批量 获取 资 
料 的 目的 。 疏 取 的 URL 如 下 : 

http://pic.sogou.com/pics/recommend?category=%B1%DA%D6%BD 

此 URL 来 自 进 入 分 类 后 的 浏览 器 的 地 址 栏 。 

写 出 如 下 代码 : 

import requests 

import urllib 

from bs4 import BeautifulSoup 

res=requests.get ('http://pic.sogou.com/pics/recommend?category= 

SB1%$DASD6%SBD') # 息 取 的 URL 

soup=BeautifulSoup (res.text, 'html .parser') 

print (soup.select ('img')) 


输出 : 


| 130 


第 6 章 疏 虫 应 用 一 一 抓 取 百度 图 片 


[<img alt=" 搜 狗 图 片 " src="/news/images/tupian130x34 @lx.png" srcset= 

"/news/images/tupian130x34 @2x.png 2x"/>, <img class="st-load" src=""/>] 

此 时 发 现 输出 内 容 并 不 包含 想 要 的 图 片 元 素 ， 而 是 只 剖析 到 Logo ( 见 图 6-3) 的 img， 
这 显然 不 是 大 家 想 要 的 。 也 就 是 说 , 需要 的 图 片 资料 不 在 “http://pic.sogou.com/pics/recommend? 
category= %B1%DA%D6%BD” 的 HTML 源 代码 里 面 。 


© 


图 6-3 tupian130x34 @1x.png 
这 是 为 什么 呢 ? 可 以 发 现 当 在 网 页 内 向 下 滑动 鼠标 滚轮 时 图 片 是 动态 刷新 出 来 的 ， 也 
就 是 说 ， 该 网 页 并 不 是 一 次 加 载 出 全 部 资源 ， 而 是 动态 加 载 资源 。 这 也 避免 了 因为 网 页 过 
于 腾 肿 而 影响 加 载 速度 。 在 网 页 动态 加 载 中 找 出 图 片 元 素 的 方法 如 下 : 
按 F12 键 ， 在 Network 的 XHR 下 单 击 文件 链接 ， 在 Preview 选项 卡 中 观察 结果 ， 如 
图 6-4 所 示 。 


民 本 Bements Console Sources Network Timeline Proiles Application Security Audits 








二 | 四 了 |view 汪 去 Preserve log 国 Disable cache Offine No throttling MM 


Regex 加 Hide data URLs Al | BB 1s css Ime Media Font poc Ws Manifest other 


| 10000ms 20000ms 30000 ms 40000ms 50000ms 60000ms 70000ms a0 
Name x Headers Preview Response Cookies Timing 
[] getAlRecomPicByTagjsp?category=%E5%6A3%81%E73%68A%B88ttag=%E-， {category:“ 壁 纸 "，tag: “全 部 "，star 
pall items: [{id: 11984943，did: 8,..}, {id: 
cotcgony:“" 莅 纸 " 





itemsOnPage: 9 
1/ 36 requests 1 3.0KB /7.1 KB transferred | Finish: 23 min | DOMC maxEnd: 12129 


图 6-4 分 析 网 页 的 JSON 数据 


说 明 : XHR 的 全 称 为 XMLHttpRequest， 中 文 解释 为 可 扩展 超 文 本 传输 请 求 。 其 中 ， 
XML 是 可 扩展 标记 语言 ，Http 是 超 文本 传输 协议 ,， Request 是 请 求 。XMLHttpRequest 对 象 
可 以 在 不 向 服务 器 提交 整个 页 面 的 情况 下 实现 局 部 更 新 网 页 。 当 页 面 全 部 加 载 完毕 后 ， 客 
户 端 通过 该 对 象 向 服务 器 请 求 数据 ， 服 务 器 端 接收 数据 并 处 理 后 向 客户 端 反馈 数据 。 
XMLHttpRequest 对 象 提供 了 对 HITP 协议 的 完全 访问 ， 包 括 做 出 POST 和 HEAD 请 求 以 
及 普通 的 GET 请 求 的 能 力 。XMLHttpRequest 可 以 同步 或 异步 返回 Web 服务 器 的 响应 ， 并 
且 能 以 文本 或 者 一 个 DOM 文档 的 形式 返回 内 容 。 尽 管 名 为 XMLHttpRequest， 但 它 并 不 限 
于 和 XML 文档 一 起 使 用 ， 它 可 以 接收 任何 形式 的 文本 文档 。XMLHttpRequest 对 象 是 为 
AJAX 的 Web 应 用 程序 架构 的 一 项 关键 功能 。 

单 击 图 6-4 中 的 JSON 数据 all_ items， 发 现下 面 是 一 个 个 貌似 图 片 的 元 素 。 试 着 打开 
一 个 URL， 发 现 确实 是 图 片 的 地 址 。 找 到 目标 之 后 单 击 XHR 下 的 Headers 得 到 : 

http://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category=%ES5%A3%81%E7 
%BA9%B8&tag=-%E59%085$%0A8%0E99%083%0A8&start-0&len=1S& width=1536&helght=-864 

试 着 去 掉 一 些 不 必要 的 部 分 ， 技 巧 就 是 删 掉 可 能 的 部 分 之 后 访问 不 受 影 响 ， 最 后 得 到 
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的 URL 如 下 : 
http://pic.sogou.com/pics/channel/getAllRecomPicByTag.jsp?category=%E5%A3%81%E7 
%BA9?%B8&tag=9%0ES9%085%0A89%0E99083%0A8&start=0&len=15 
从 字面 意思 知道 category 后 面 可 能 为 分 类 。start 为 开始 下 标 ，len 为 长 度 ， 即 图 片 的 数 
量 。 通 过 这 个 URL 请 求 得 到 响应 的 JSON 数据 中 包含 着 用 户 所 需要 的 图 片 地 址 。 有 了 上 面 
的 分 析 可 以 写 出 以 下 代码 : 


import requests 




















import json 
import urllib 
def getSogouImag (category, length, path): 
n=length 
Cate=category 
imgs=requests.get('http://pic.sogou.-com/pics/Vchannel/ 
getAllRecomPicByTag.jsp?category='+cate+'&tag=%E5%85%A8$%E9%83%$A8&start= 
Oglen="'+str (n)) 
jd=json.1oads (imgs .text) 
jd=jd['all items'] 
imgs url=[] 
Efor J in jd 
imgs url.append(j['bthumbUrl']) 
m=0 
for img url in imgs url: 
print ('***** +Str (m)+" .jpg *****'+"'Downloading."') 
urllib.request.urlretrieve (img url,path+str (m)+' .jpg') 
m=m+1 
print('Download complete!') 
getSogouImag (' 壁 纸 ',200, 'D:/download/ 壁 纸 /') 
# 下 载 200 张 图 片 到 D 盘 download 下 的 “壁纸 ”文件 夹 中 


程序 运行 结果 如 图 6-5 所 示 。 


OE D) donna » BR 


IRm em 


#5 OU al S 过 ofF 关 





图 6-5 的 取 到 DD 盘 download 下 “壁纸 ”文件 夹 中 的 图 片 
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至 此 ， 关 于 该 怜 虫 程序 的 编程 介绍 完毕 。 从 整体 来 看 ， 找 到 需要 礁 取 元 素 所 在 的 url 





是 仆 虫 诸多 环节 中 的 关键 。 
有 了 用 搜狗 图 片 下 载 图 片 的 基础 ， 下 面 来 实现 百度 图 片 的 图 片 下 载 。 





6.4 程序 设计 的 步骤 





6.4.1 分 析 网 页 源 代码 和 网 页 结构 





进入 百度 图 片 界面 (https://image.baidu.com/)， 输 入 某 个 关键 字 (例如 夏 敏捷 )， 然 后 














单 击 “百度 一 下 ”按钮 搜索 ， 可 见 如 下 网 址 : 


AD 


https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=——1&cl=2&ie=g 
bk&word=%CF%C4%C3%F4%BDY%DD&fr=ala&ala=1 &alatpl=adress&pos=0&hs=2&xthttps 


=L11111 


其 中 ，%CF%C4%C3%F4%BD%DD 就 是 “ 夏 敏捷 ”的 URL 编码 (网 址 上 不 使 用 汉字 )， 
所 看 见 的 页 面 是 “瀑布 流 版 本 ”( 如 图 6-6 所 示 )， 当 向 下 滑动 的 时 候 可 以 不 停 刷新 ， 这 是 
一 个 动态 的 网 页 (和 搜狗 图 片 类 似 ， 需 要 按 F12 键 ， 通 过 Network 下 的 XHR 去 分 析 网 页 
的 结构 )， 而 用 户 可 以 选择 更 简单 的 方法 ， 就 是 单 击 网 页 右上 方 的 “传统 翻 页 版 本 ”( 如 

















图 6-7 所 示 )。 













他 丁 守 图 片 百度 拉 过 关 ， 当 (tpsyfimage, 


€ 3C fhttps//image.baidu.c 
洪 店 用 园 瑞 网站 站 从 下 中 SA 人 台 [E 朗 -下 ] 


alt | 


网 页 新 闻 贴吧 知道 音乐 图 片 视频 地 图 文库 更 多 


到 百度 本 片 -发现 交大 也 办 





车] 党 更 Se 百 朗 本 搜索 





QQ 相关 搜索 : ”敏捷 过 。 何 敏捷 。 敬 措 桩 。 敏捷 ”敏捷 太 。 叶 敏 捷 。” 伐 竹 接 ”敏捷 型 。 赵 涩 十 。 贺 涩 秆 。 吕 笋 捷 。 杨 敏捷 。” 范 敏捷 。 顾 敏 撞 











图 6-6 瀑布 流 版 本 下 的 图 片 
在 传统 翻 页 版 本 下 的 浏览 器 地 址 栏 中 可 见 如 下 网 址 : 


A 1&st=-l&fm=re: 


| 








‘sultalr= Bs’ 


韩 敏 撞 





: 汪 目 








https://image.baidu.com/search/flip?tn=baiduimage&ie=gbk&word=%CF%C4%C3%F4% 


BD%DDé&ct=201326592&lm=——1&v=tlip 
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?tn=baiduimage&ie=utf-8&word= 豆 敏捷 &ct=201326592&ic=0&lm=-l&width=&l 妆 | 三 


ES nt, ee 


Q 相关 搜索 繁 捷 套 。 何 敏 捷 ”敏捷 术 ”敏捷 ”敏捷 太 。 叶 敏捷 。 伐 繁 丘 ” 敏 寺 型。 。 赵 残 于 。 如 到 过 。 吕 各 接 。 杨 敏捷 。 范 敏 圭 。 跨 敏 捷 。 韩 和 捷 























图 6-7 传统 翻 页 版 本 下 的 图 片 


在 传统 翻 页 版 本 下 单 击 “ 下 一 页 ”或 某 数字 页 码 ， 网 址 会 发 生变 化 ， 而 动态 网 页 则 不 
会 ， 因 为 其 分 页 参数 是 在 POST 请 求 中 的 。 在 该 程序 中 使 用 这 个 网 址 请 求 页 面 。 

在 网 页 空白 处 右 击 选 择 “ 查 看 网 页 的 源 代码 ”命令 ,可 以 查看 网 页 的 源 代码 (如 图 6-8 
所 示 )， 也 就 是 requests get 下 来 的 数据 ， 在 这 里 面 找到 各 个 图 片 的 链接 和 下 一 页 的 链接 比 
较 困 难 。 























act 
/记录 而 面 开始 时 间 
Window page3tartTine = new Date0 
window, scrollTo (0, 0) 


styleshect” types’ tort/cse” 
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t es Vs bi /bod “esript》 alogC peed cot ， 
《hedy class=" Flin” soript type tert/ Javsscript >reqnire. sitells hh reanre. sitals([ "searchrest-, common ]] :rea re,resourcallap (人 
{canon widget /ui/ basa/base, js": { 1":"// ng0, bestatic, oy st stic/comor eidget /ui/ base/base, a66cs01 js"|, "comam:wides/ Ui/arch/ ro 
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y Phe :comaor: D1"} “common rwidget /vi /base/ erents. js 
“common:pl” ,deps”: 
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图 6-8 ”传统 翻 页 版 本 下 的 图 片 


用 户 可 以 通过 浏览 器 (例如 Chrome) 的 开发 者 工具 来 查看 网 页 的 元 素 ， 按 F12 键 打 
开 开发 者 工具 来 查看 网 页 样式 ， 注 意 当 鼠 标 从 结构 表 中 滑 过 时 会 实时 显示 此 段 代 码 所 对 应 
的 位 置 区 域 (注意 先 要 单 击 开发 者 工具 右上 角 的 箭头 按钮 用 户 可 以 通过 此 方法 快速 地 找 
到 图 片 元 素 所 对 应 的 位 置 ( 如 图 6-9 所 示 )。 
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RR | Bemeng Console Sources Network Timeine Profl 
一 一 一 . nv 
div 
diy -specialRecomend'yt/div 
vediv Id-"ingid 
vol i 


Seariy Awdits 











get="_blank” class="inglink” style="wi 
jing sre= "https: //ssd, bdstatic ,con/79cFunSh OlvnxGkpoW LF hhy/it /ve3; 
/a 








lass="hover”title="net 程序 设计 教 香 /<strong> 槛 第 擅 (/strong> 等 -</div 






Width:372p0 "Yd /1 


hi botyfip_dvewrpper cvsmgContiner dimgd uinglet lingien aingine EY 





图 6-9 图 片 元 素 所 对 应 的 位 置 


对 图 6-9 分 析 可 知 ， 每 个 图 片 都 在 <ul class="imglist"> 下 的 列表 项 <li class="imgitem" 
style="width:372px:"> 中 ， 其 中 <img sre="..."> 保 存 图 片 的 网 址 。 


<div id="imgid"> 
<ul class="imglist"> 
<1i class="imgitem" style="width:372px;"> 
<a target=" blank" 
<img src="https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1lHF6hhy/it/ 


u=3577097530, 1691750734&amp; fm=27&amp; gp=0.jpg”alt="net 程序 设计 教程 "> 





</a> 
<div class="hover" title="net 程序 设计 教程 /<strong> 夏 敏捷 </strong> 
等 "></div> 
</1i> 


从 上 面 找到 了 一 张 图 片 的 路 径 : 

https://ss0.bdstatic.com/70cFuHSh Ql1YnxGkpoWK1HF6hhy/it/u=3577097530,16917507 
34&amp:fm=27&amp:gp=0.jpg 

用 户 可 以 在 HIML 源 代码 中 搜索 此 路 径 找 到 它 的 位 置 ， 如 下 : 


flip.setData ('imgData', 

{ "queryEnc":"%E5%A4%8F%E6%95%8F%E6%8D$B7", "displayNum":5722, "bdIsClustered" : 
mie TistNum” L977, "bdpmtDispHun® : "5722”, wbdsSearchTime” 2 wy 
"isNeedAsyncRequest":0, 

"data": [{"thumbURL": "https://ss0.bdstatic.com/70cFuHSh 
QlYnxGkpoWK1HF6hhy/it/u=3577097530,1691750734&fm=27&gp=0.jpg", 
"middleURL":"https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1lHF6hhy/it/u= 
3577097530, 1691750734&fm=27&gp=0.jpg", "largeTnImageUrl":"", "hasLarge" :0, 
"hoverURL":"https://ss0.bdstatic.com/70cFuHSh QlYnxGkpoWK1HF6hhy/it/u= 
3577097530,1691750734&fm=27&gp=0.jpg", "pageNum":0, 

"objURL": "http://img13.360buyimg.com/n0/jfs/t586/241/26929280/71476/ 
2c65610c/54484fe6Nb33010bd.jpg", 

"fromURL":"ippr Zz2C$qAzdH3FAZdH3Ftpj4 z&e3B31 z&e3Bv54AzdH3F8nc9adan0n 
ZzZ&e3Bip4s", "fromURLHost":"item.jd.com", "currentIindex":"", "width":800, 
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"height"=-800, “type”:" pg "Filesizen"" “pqSrcType": "0 
Waims "3526015A4990" "pl mOw "lis 0 0 "partnerld" 0 "badSsetTngiom": oO 
"bdImgnewsDate":"1970-01-01 08:00", 


可 见 “thumbURL”“middleURL ”和 “objURL” 均 是 图 片 的 所 在 网 址 ， 
“objURL” 对 应 的 网 址 图 片 ， 所 以 写 出 如 下 正则 表达 式 获取 图 片 的 所 在 网 址 : 


re.findall ('"objURL":"(.*?)"',content, re.s) 


通过 分 析 可 知 ,“ 下 一 页 ”或 某 数 字 页 码 HTML 的 代码 如 下 : 


<div id="page"> 








<strong><span class="pc">1</span></strong> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=$E5%A4%8F%E6%95%8F%E6%8D%B7 
&pn=20&gsm=3c&ct=&ic=0&lm=-1&width=0gheight=0"><span class="pc" data="right"> 
2</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%8F%$E6%95%8F%E6%8D%B7 
&pn=40&gsm=0&ct=&ic=0&1m=-1&width=0&height=0"><span class="pc" data= 
"right">3</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A4%8F%E6%95%8F%E6%8D%SB7 
&pn=180&gsm=0&ct=&ic=0&1m=-1&width=0&height=0"><span class="pc" data= 
"right">10</span></a> 

<a href="/search/flip?tn=baiduimage&ie=utf-8&word=%$E5%A4%8F%E6%95%8F%E6%8D%B7 
&pn=20&gsm=3c&ct=&ic=0&lm=-1&width=0&height=0" class="n"> 下 一 页 </a> 
</div> 


所 以 获取 “下 一 页 ”链接 写 出 如 下 正则 表达 式 : 


re.findall('<div id="page">.*<a href="(.*?)" class="n">',content, re.s) [0] 


6.4.2 ”设计 代码 


Python 爬虫 搜索 百度 图 片 库 并 下 载 图 片 的 代码 如 下 : 





import requests ## 首 先导 入 库 视频 讲解 

import re 

# 设 置 默 认 配 置 

MaxSearchPage=20 # 搜 索 页 数 

CurrentPage=0 # 当 前 正在 搜索 的 页 数 

DefaultPath="pictures" # 默 认 储 存 位 置 

NeedSave=0 # 是 否 需 要 储存 

# 图 片 链接 正则 和 下 一 页 的 链接 正则 

def imageFiler (content): # 通 过 正则 获取 当前 页 面 的 图 片 地 址 数组 
return re.findall('"objURL":"(.*?2)""',content, re.s) 

def nextSource (Content) : # 通 过 正则 获取 下 一 页 的 网 址 


next=re.findall('<div id="page">.*<a href="(.*?)" class="n">', 


content, re.s) [0] 
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print ("————————— "+"http://image.baidu.com"+next) 
return next 
# 扑 虫 主体 
def spidler (source) : 
Content=requests .get (source) .text # 通 过 链接 获取 内 容 
imageArr=imageFiler (content) # 获 取 图 片 数 组 
global CurrentPage 
print ("Current page:"+str (CUTTen 七 Pagle ) 十 "本 本 可 可 可 束 事 可 可 可 束 事 可 可 可 四 ) 
for imageUrl in imageRArr: 
print (imageUr1) 
global NeedSave 
if NeedSave: # 如 果 需 要 保存 图 片 则 下 载 图 片 ， 否 则 不 下 载 图 片 
global DefaultPath 
EE 
# 下 载 图 片 并 设置 超时 时 间 ， 如 果 图 片 地 址 错误 就 不 继续 等 待 了 


picture=requests.get (imageUr1l,timeout=10) 


except: 
print ("Download image error! errorUrl:"+imageUrl) 
continue 

# 创 建 图 片 保存 的 路 径 

imageUrl=imageUrl .replace('/','') .replace(':',''). 


replace('?','') 
pictureSavePath=DefaultPath+imageUrl 
fp=open (pictureSavePath, 'wb') # 以 写 入 二 进 制 的 方式 打开 文件 
fp.write (picture.content) 
fp.close() 
global MaxSearchPage 
if CurrentPage<=MaxSearchPage: # 继 续 下 一 页 爬 取 
if nextSource (Content) : 
CurrentPage+=1 
# 疏 取 完毕 后 通过 下 一 页 地 址 继续 爬 取 
spidler ("http://image.baidu.com"+nextSource (Content) ) 
# 疏 虫 的 开启 方法 
def beginSearch (page=l, save=0, savePath="pictures/"): 
# (page: 有 让 取 页 数 , save :是 否 储存 , savePath :默认 储存 路 径 ) 
global MaxSearchPage,NeedSave,DefaultPath 


MaxSearchPage=page 
NeedSave=save # 是 否 保存 ， 值 为 0 不 保存 ，1 保存 
DefaultPath=savePath # 图 片 保存 的 位 置 


key=input ("Please input you want search: ") 
StartSource="http://image.baidu.com/search/flip?tn= 
baiduimage&ie=utf-8&word="+str (key)+"&ct=201326592&v=flip" 
埋 分 析 链 接 可 以 得 到 ， 蔡 换 其 "word" 值 后 面 的 数据 来 搜索 关键 词 

spidler (StartSource) 


# 调 用 开启 的 方法 就 可 以 通过 关键 词 搜索 图 片 了 
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从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
beginsearch (page=5, save=1) #page=5 是 下 载 前 5 页 ，save=1 为 保存 图 片 
运行 后 输入 搜索 关键 词 ， 例 如 “ 夏 敏 捷 ”， 可 以 在 pictures 文件 夹 下 得 到 夏 敏捷 的 相关 
图 片 ， 如 图 6-10 所 示 。 这 里 下 载 的 图 片 的 命名 采用 的 是 下 载 的 网 址 ， 所 以 需要 去 除 文件 名 
不 允许 的 特殊 字符 ,例如 “:”“/”“?” 等 。 当 然 , 更 好 的 处 理 方法 是 文件 名 采用 数字 编号 ， 
避免 网 址 中 出 现 特殊 字符 。 





页 四 ， 务 14 坟 ) Python 起 扣子 项 上 和 ( Pyhhon 妆 必 丽 】 ， Pic rs Bo E73 万 





癌 hapa-eetimegeremasonconsresrvG28800K-Catolossh20101117BO0aolFGvQ 01 omanipg 

rmpimao02 21mimg comphororalbum20150511m6005C25578C2NECOHF4324EAEEBCAFO18Cjpeg 

网 htpimga ddimaenl091293579892-1.。 2ipg 

加 hapimgl3360bmimg commgfa58524126329280714762c85610c54434fe6Nb3010bdjpg 

apimg ld 360beyimg commgd127330922856897010984d71s1v0550bS53bN602。3537jp 
sneer 























图 6-10 ”pictures 文件 夹 下 得 到 相关 图 片 
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7.1 itchat 功能 介绍 


本 程序 运行 后 会 出 现 一 张 二 维 码 图 片 ， 微 信用 户 通过 微 信 扫描 二 维 码 
登录 自己 的 微 信 ， 此 时 如 果 有 好 友 发 过 来 信息 ， 则 微 信 机 器 人 会 自动 回复 好 友 ， 效 果 如 
图 7-1 所 示 。 在 该 图 中 可 以 看 到 当 好 友 发 过 来 “你 好 吗 ” 微 信 机 器 人 会 自动 回复 “还 不 错 ， 
你 呢 ”， 当 好 友 发 过 来 “ 讲 个 笑话 吧 ”， 微 信 机 器 人 会 自动 回复 一 个 笑话 ， 当 好 友 问 “郑州 
天 气 ? ”时 ， 微 信 机 器 人 会 自动 回复 天 气 情况 ， 等 等 。 











< 上 
mm 图 
起 还 不 错 ， 你 呢 
卷 节 快乐 品 
本 万 事 如 意 心 想 事 成 ， 红 包 拿 来 。 
mm 国 


本 郑州 : 周 六 ,多 云 转 小 雨 东北 风 油 风 ， 
最 低 气 温 2 度 ， 最 高 气温 11 度 


讲 个 实 泛 吧 


国 :nsrsssasas, ent 
界 和 平 。 第 二 次 世界 大 战 间 ,， 逢 
国 的 将 领 和 士兵 经 常 出 入 巴黎 的 毕 
加 索 艺术 馆 ， 在 艺术 馆 的 出 口 处 ， 
毕 加 素 发 给 每 个 德国 军人 一 幅 他 的 
名 画 { 丫 尔 尼 卡 》 的 复制 品 ， 这 模 


二 ”个 


GO) ® 


图 7-1 微 信 机 器 人 聊天 效果 





| 让 要 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


7.2 程序 设计 的 思路 





























该 程序 需要 用 到 一 个 Python 库 一 一 itchat，itchat 是 一 个 开源 的 微 信 个 人 账号 的 接口 ， 
可 以 使 用 该 库 进行 微 信和 网 页 版 中 的 所 有 操作 ; 另外 还 需要 用 到 图 灵机 器 人 API， 图 灵机 器 
人 是 一 个 中 文 语 境 下 的 对 话机 器 人 。 本 章 主要 使 用 itchat 库 和 图 灵机 器 人 API 完成 一 个 能 
够 处 理 微 信 消 息 的 图 灵机 器 人 ， 包 括 好 友 聊 天 、 群 聊天 。 


7.3 ”关键 技术 
7.3.1 安装 itchat 


itchat 是 一 个 开源 的 微 信 个 人 账号 的 接口 ， 使 得 Python 调用 微 信 功能 从 未 如 此 简单 ， 
用 户 使 用 不 到 三 十 行 的 代码 就 可 以 完成 一 个 能 够 处 理 所 有 信息 的 微 信 机 器 人 。itchat 库 已 经 
做 好 了 用 代码 调用 微 信 的 大 多 数 功 能 ， 使 用 起 来 非常 方便 ， 官 方 技术 文档 的 网 址 为 
“http:Witchat readthedocs.io/zhylatest/”， 用 户 在 使 用 时 需要 安装 itchat 库 , 在 安装 的 时 候 使 用 
pip 即 可 。 





























pip install itchat 


7.3.2 itchat 的 登录 微 信 


运行 以 下 代码 ， 会 出 现 一 张 图 7-2 所 示 的 二 维 码 ， 扫 码 登 录 之 后 将 会 给 “文件 传输 助 
手 ” 发 送 一 条 “Hello, filehelper” 的 消息 。 





图 7-2 二 维 码 
import itchat # 加 载 itchat 库 
itchat .auto login() # 登 录 微 信 


# 发 送 文本 消息 ， 发 送 目标 是 “文件 传输 助手 ” 


itchat.send('Hello, filehelper', toUserName='filehelper') 
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7.3.3 itchat 的 消息 类 型 


itchat 支持 所 有 的 消息 类 型 与 群 聊 。 在 itchat 中 定义 了 文本 、 图 片 、 名 片 、 位 置 、 通 知 、 
分 享 、 文 件 等 多 种 消息 类 型 ， 可 以 分 别 执行 不 同 的 处 理 。 下 面 的 示例 注册 了 一 个 消息 响应 
事件 ， 用 来 定义 接收 到 文本 消息 后 如 何 处 理 。 

import itchat 

# 注 册 消 息 响 应 事件 ， 消 息 类 型 为 itchat .content .TEXT， 即 文本 消息 ， 把 装饰 器 写成 下 面 的 形 

# 式 即 可 

@itchat.msg register (Itchat.content .TEXT) 

def text reply (msg): 

# 返 回 同样 的 文本 消息 


Freturn msg['Text'] 



































itchat .auto login() # 登 录 微 信 
# 绑 定 消息 响应 事件 后 让 itchat 运行 起 来 ， 监 听 消 息 
itchat .run() 


itchat.content 中 包含 所 有 的 消息 类 型 参数 ， 如 表 7-1 所 示 。 
表 7-1 itchat.content 中 所 有 的 消息 类 型 参数 








参数 类 型 Text 键 值 
TEXT 文本 文本 内 容 (文字 消息 ) 
MAP 地 图 位 置 文本 位 置 分 享 ) 
CARD 名 片 推荐 人 字典 (推荐 人 的 名 片 ) 
SHARING 分 享 分 享 名 称 〈 分 享 的 音乐 或 者 文章 等 ) 
PICTURE 图 片 /表情 下 载 方 法 
RECORDING 语音 下 载 方法 
AITACHMENT 附件 下 载 方 法 
VIDEO 小 视频 下 载 方 法 
FRIENDS 好 友 邀 请 添加 好 友 所 需 参数 
SYSTEM 系统 消息 更 新 内 容 的 用 户 或 群 聊 的 UserName 组 成 的 列表 
NOTE 通知 通知 文本 〈 消 息 撤回 等 ) 











比如 需要 存储 发 送 给 自己 的 附件 : 
Qitchat.msg register (ATTACHMENT) 
def download files (msg): 
msg['Text'] (msg['FileName']) 
msg 字典 的 Text 键 是 个 下 载 方法 (函数 )， 可 以 下 载 文件 。 
再 来 看 如 何 处 理 其 他 类 型 的 消息 ， 可 以 在 消息 响应 事件 里 把 msg 打印 出 来 ， 它 是 一 个 
字典 ， 看 有 哪些 感 兴趣 的 字段 。 下 面 演示 了 对 这 些 消 息 类 型 的 简单 处 理 。 


import itchat 
from itchat.content import * #import 全 部 消息 类 型 
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| 项 目 案例 开发 
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坦 处 理 文本 类 消息 ， 包 括 文本 、 位 置 、 名 片 、 通 知 、 分 享 
Qitchat.msg register([TEXT, MAP, CARD, NOTE, SHARING]) 
def text reply(msg): 
# 微 信里 的 每 个 用 户 和 群 聊 都 使 用 ID 来 区 分 ，msg['FromUserName"' ] 就 是 发 送 者 的 ID 
# 将 消息 的 类 型 和 文本 内 容 返 回 给 发 送 者 
itchat.send('%$s: $s' $ (msg['Type'], msg['Text']), msg['FromUserName']) 


# 处 理 多 媒体 类 消息 ， 包 括 图 片 、 录 音 、 文 件 、 视 频 
Qitchat.msg register([PICTURE, RECORDING, ATTACHMENT, VIDEO]) 
def download files (msg): 
#msg['Text'] 是 一 个 文件 下 载 函 数 ， 传 入 文件 名 ， 将 文件 下 载 下 来 
msg['Text'] (msg['FileName']) 
# 把 下 载 好 的 文件 再 发 给 发 送 者 
return '@%s@%s' $ ({'Picture':'img','Video':'vid'}.get (msg['Type'], 
'fil'), msg['FileName']) 


# 处 理 好 友 添加 请 求 ， 收 到 好 友 邀 请 自动 添加 好 友 

Qitchat .msg register (FRIENDS) 

def add friend (msg) : 
itchat.add _ friend (**msg['Text']) # 该 操作 会 自动 将 新 好 友 的 消息 录入 ， 不 需要 重 载 通讯 录 
# 加 完好 友 后 给 好 友 打 个 招呼 


itchat.send msg('Nice to meet You!'，msg['RecommendInfo'] ['UserName']) 


# 处 理 群 聊 消 息 ， 在 注册 时 增加 isGroupchat=True 将 判定 为 群 聊 回复 
Qitchat.msg register (TEXT, isGroupChat=True) 
def text reply(msg): 
if msg['isAt']: 
itchat.send(u'@%s\u2005I received: %s' % (msg['ActualNickName'], 
msg ['Content']), msg['FromUserName']) 


# 在 auto_login() 里 面 提供 一 个 True， 即 hotReload=True 

# 即 可 保留 登录 状态 ， 即 使 程序 关闭 ， 在 一 定时 间 内 重新 开启 也 可 以 不 重新 扫 码 
itchat .auto login (True) 

itchat .run() 


在 PICTURE、RECORDING、ATTACHMENT、VIDEO 几 类 的 msg 字典 的 Text 键 下 





存放 了 用 于 下 载 消 息 内 容 的 函数 ， 传 入 文件 名 即 可 下 载 ， 被 发 送 的 文件 名 都 存储 在 msg 的 
FileName 键 中 。 


区 分 群 聊 消息 还 是 与 好 友 聊 天 ， 在 注册 时 增加 isGroupChat=Trme 将 判定 为 群 聊 回复 。 
例如 注册 @itchat.msg_register(TEXT，isGroupChat=True) 将 判定 为 群 聊 回 复 ， 而 注册 








@itchat msg_register(TEXT) 将 判定 为 与 好 友 聊 天 。 


值得 注意 的 是 ， 群 消息 增加 了 3 个 键 值 : 
isAt : 判断 是 否 @ 本 号 自己 ActualNickName: 实际 NickName; Content :信息 内 容 
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可 以 通过 以 下 程序 测试 : 
import itchat 
from itchat.content import TEXT 
Qitchat.msg register (TEXT, isGroupChat=True) 
def text reply (msg): 
if (msg.isAt): # 判 断 是 否 有 人 人 自己 
# 如 果 有 人 人 @ 自 己 ， 就 发 一 个 消息 告诉 对 方 已 经 收 到 了 信息 
itchat.send msg(" 我 已 经 收 到 了 来 自 {0} 的 消息 ， 实 际 内 容 为 {L1}j".format (msg 
['"RActualNickName"'],msg['Text']),toUserName=msg['FromUserName']) 
print (msg.isRt) # 输 出 True 或 False 
print (msg.actualNickName) 
print (msg.text) 
itchat.auto login() 
itchat.run() 


7.3.4 itchat 回复 消息 


itchat 提供 了 5 种 回复 方法 ， 建 议 用 户 直 接 使 用 send() 方 法 。 

@ send( 方 法 

格式 : 

send (msg='Text Message', toUserName=None) 

参数 : 

。 msg: 发 送 消息 的 内 容 ， '@ 包 @ 文 件 地 址 将 会 被 识别 为 传送 文件 ，'@img@ 图 片 地 
址 ' 将 会 被 识别 为 传送 图 片 ，'@vid@ 视 频 地 址 ' 将 会 被 识别 为 传送 小 视频 。 

。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 

发 送 成 功 为 True， 失 败 为 False。 

程序 示例 : 

import itchat 

itchat .auto login() 

itchat .send('"Hello world!') 

# 请 确保 该 程序 目录 下 存在 gz .gif、xlsx.xlsx 和 demo.mp4 文件 

itchat.send('@img@%s' $ 'gz.gif') 

itchat.send('@fil@%s' 当 'xlsx.xlsx') 

itchat.send('@vid@%s' %$ 'demo.mp4') 


四 send_msg0 方 法 
格式 : 


send msg (msg='Text Message', toUserName=None) 


参数 : 
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。 msg: 消息 内 容 。 

。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 
返回 值 : 

发 送 成 功 为 Tue， 失 败 为 False。 

程序 示例 : 


import itchat 





itchat.auto login() 
itchat.send msg('Hello world') 


@ send_file0 方 法 
格式 : 


send file(fileDir，toUserName=None) 


参数 : 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 

发 送 成 功 为 True， 失 败 为 False。 

程序 示例 : 

import itchat 

itchat.auto login() 

# 请 确保 该 程序 目录 下 存在 x1szx.xlsz 文件 


itchat.send file('xlsx.xlsx') 


@ send_img0 方 法 

格式 : 

send img (fileDir, toUserName=None) 

参数 : 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 

发 送 成 功 为 True， 失 败 为 False。 

程序 示例 : 


itchat .send img('gz.gif') 


全 send_video() 方 法 
格式 : 


send video (fileDir，toUserName=None) 

。 fileDir: 文件 路 径 〈 不 存在 该 文件 时 将 打印 无 此 文件 的 提醒 )。 
。 toUserName: 发 送 对 象 ， 如 果 留 空 将 会 发 送 给 自己 。 

返回 值 : 
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发 送 成 功 为 Tue， 失 败 为 False。 
程序 示例 〈 需 要 保证 发 送 的 视频 为 一 个 实际 存在 的 MP4 文件 ): 
itchat .send file('demo.mp4') # 请 确保 该 程序 目录 下 存在 demo .mp4 文件 


7.3.5 itchat 获取 账号 


在 使 用 个 人 微 信 的 过 程 中 主要 有 3 种 账号 需要 获取 , 分 别 为 好 友 、 公众 号 、 群 聊 。itchat 
为 这 3 种 账号 提供 了 整体 获取 方法 与 搜索 方法 ， 而 群 聊 多 出 获取 用 户 列表 的 方法 以 及 创建 
群 聊 、 增 加 和 删除 用 户 的 方法 。 这 里 分 别 介绍 这 3 种 账号 的 使 用 方法 。 

@ 杂 友 

好 友 的 获取 方法 为 get_friends(), 将 会 返回 完整 的 好 友 所 组 成 的 列表 , 其 中 每 个 好 友 为 
一 个 字典 ,列表 的 第 1 项 为 本 人 的 账号 信息 ， 如 果 传 入 update 参数 为 True， 可 以 更 新 好 友 
列表 并 返回 。 

下 面 是 某 个 好 友 的 字典 信息 : 

{ "OwnerUin': 0, 'APPRccountF1ag': 0，'DisplayName': '', 'KeyWord': ' 

"IsOwner': 0，'EncryChatRoomId': !'"，'NickName': ' 富 兰 克 林 '，'UniFriend': 0， 

'ContactFlag': 3, 'Province': ' 上 海 ',， 'RemarkPYInitial': 'FLKLFBK', 

'UserName': '@bef3be95365d187525526e8f4al85cb0d06de5385d8c2b6d9a705ed39 

e691c88', 'HeadImgUrl': '/cgi-bin/mmwebwx-bin/webwxgeticon?seq=636140456& 

username=@bef3be95365d187525526e8f4al85cb0d06de5385d8c2b6d9a705ed39e691 
c88&skey=@crypt 4a30791b 8487e5all7a9ec8b721ccfdl7fe7da2f', 'Signature': 

' 范 本 已 '，'PYQuanPin': 'fulankelin', 'Sex': 1, 'SnsFlag': 49, 'Attrstatus': 

33788221， 'MemberCount': 0，'VerifyFlag': 0，'RemarkName': ' 富 兰 克 林 范 本 恺 '， 

'PYInitial': 'FLKL', 'RemarkPYQuanpin': 'fulankelinfanbenkai', 'City': '', 

gin: O。 MomberList,: <Contactbist (>> Alias "otarErieond: Or 

'ChatRoomId': 0, 'Statues': 0, 'HideInputBarFlag': 0} 

从 中 可 以 得 到 好 友 的 省 份 (' Province ')、 用 户 ID ("UserName')、 性 别 ('Sex'， 值 1 表 
示 男 ) 等 信息 。 

好 友 的 搜索 方法 为 search_friends()， 其 有 4 种 搜索 方法 : 

1) 仅 获取 自己 的 用 户 信息 


itchat .search friends () # 获 取 自 己 的 用 户 信息 ， 返 回 自己 的 属性 字典 
2) 获取 特定 UserName 的 用 户 信息 


# 获 取 特 定 UserName 的 用 户 信息 
itchat -search friends (userName='@abcdefg1234567') 


3) 获取 备注 、 微 信号 、 昵 称 中 的 任何 一 项 等 于 name 键 值 的 用 户 
# 获 取 任何 一 项 等 于 name 键 值 的 用 户 


itchat.search friends (name="'littlecodersh') 
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从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 

4) 获取 备注 、 微 信号 、 昵 称 分 别 等 于 相应 键 值 的 用 户 

# 获 取 分 别 对 应 相应 键 值 的 用 户 

itchat .search friends (wechatAccount="'littlecodersh') 

第 3 种 和 第 4 种 方法 可 以 一 起 使 用 ， 下 面 是 示例 程序 : 

itchat.search _ friends (name="'LittleCoder 机 器 人 '，wechatAccount="'littlecodersh') 
四 公众 号 

公众 号 的 获取 方法 为 get_ mps0, 将 会 返回 完整 的 公众 号 列表 ,其 中 每 个 公众 号 为 一 个 





字典 ， 传 入 update 参数 为 True 将 可 以 更 新 公众 号 列表 并 返回 。 


公众 号 的 搜索 方法 为 search_mps()， 其 有 两 种 搜索 方法 : 

1) 获取 特定 UserName 的 公众 号 

# 获 取 特定 UserName 的 公众 号 ， 返 回 值 为 一 个 字典 

itchat .search mps (userName='eabcdefg1234567") 

2) 获取 名 字 中 含有 特定 字符 的 公众 号 

# 获 取 名 字 中 含有 特定 字符 的 公众 号 ， 返回 值 为 一 个 字典 的 列表 

itcaht.search mps (name='LittleCoder') 

如 果 两 项 都 做 了 特定 ， 将 会 仅 返 回 特定 UserName 的 公众 号 ， 下 面 是 示例 程序 : 
# 以 下 方法 相当 于 仅 特定 了 UserName 

itchat. search mps (userName=" @abcdefg1234567', name='LittleCoder') 
(3 二 da 

群 聊 的 获取 方法 为 get_chatrooms()， 将 会 返回 完整 的 群 聊 列 表 ， 其 中 每 个 群 聊 为 一 个 


字典 ， 传 入 update 参数 为 True 将 可 以 更 新 群 聊 列 表 并 返回 。 


群 聊 的 搜索 方法 为 search_chatrooms()， 共 有 两 种 搜索 方法 : 
1) 获取 特定 UserName 的 群 聊 


# 获 取 特 定 UserName 的 群 聊 ， 返 回 值 为 一 个 字典 
六 和 Ca ER search chatrooms (userName=" @abcdefgl1234567') 


2) 获取 名 字 中 含有 特定 字符 的 群 聊 
# 获 取 名 字 中 含有 特定 字符 的 群 黎 ， 返 回 值 为 一 个 字典 的 列表 


itcaht .search chatrooms (name="'LittleCoder') 
如 果 两 项 都 做 了 特定 ， 将 会 仅 返 回 特定 UserName 的 群 聊 ， 下 面 是 示例 程序 : 
# 以 下 方法 相当 于 仅 特 定 了 UserName 


itchat. search chatrooms (userName='@abcdefgl1234567', name='LittleCoder') 


群 聊 用 户 列表 的 获取 方法 为 update_chatroom0， 和 群 聊 在 首次 获取 中 不 会 获取 群 聊 的 用 





户 列表 ， 所 以 需要 调用 该 方法 才能 获取 群 聊 的 成 员 ， 该 方法 需要 传 入 群 聊 的 UserName， 


返 


回 特定 群 聊 的 用 户 列表 。 
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memberList=itchat .update chatroom('@abcdefg1234567') 


创建 群 聊 以 及 增加 、 删 除 群 聊 用 户 的 方法 如 下 ， 目 前 这 3 个 方法 都 被 严格 限制 了 使 用 


频率 ， 删 除 群 聊 需 要 本 账号 为 群 管理 员 ， 和 否则 会 失败 。 


memberList=itchat.get _ friends () [1:] 

# 创 建 群 聊 ，topic 键 值 为 群 聊 名 

chatroomUserName=itchat.create chatroom (memberList， "test chatroom') 
# 删 除 群 聊 内 的 用 户 

itchat .delete member from chatroom(chatroomUserName, memberList[0]) 
# 增 加 用 户 进入 群 聊 


itchat .add member into chatroom(chatroomUserName, memberList[0]) 


7.3.6 itchat 的 一 些 简单 应 用 


@ 统计 微 信 好 友 的 男女 比例 
如 果 想 统计 一 下 自己 微 信 里 的 好 友 的 性 别 比例 ， 很 简单 ， 获 取 好 友 列表 ， 统 计 列 表 里 





的 性 别 计数 。 


import itchat 
itchat.1login() 
# 疏 取 自 己 好 友 的 相关 信息 ， 返回 一 个 好 友 列 表 
friends=itchat.get friends (update=True) [0:] 
# 初 始 化 计数 器 ， 有 男 有 女 ， 当 然 可 能 有 些 人 没 填写 性 别 
male=female=other=0 
#friends [0] 是 自己 的 信息 ， 所 以 要 从 friends [1] 开 始 
for i in friends[1:] :# 遍 历 这 个 列表 ， 列 表 中 的 第 1 位 是 自己 ， 所 以 从 "自己 "之 后 开始 计算 
sex=i["Sex"] 
if sex==1: #1 表示 男性 ，2 表示 女性 
male+=1 
elif sex==2: 
female+=1 
else: 
other +=1 
# 计 算 朋 友 总 数 
total=len (friends[1:]) 
# 打 印 出 自己 好 友 的 性 别 比例 
print ("男性 好 友 : $.2f%%"% (float (male) /total*100)+"\n"+ 
"女性 好 友 : $.2f8%"% (float (female) /total*100)+"\n"+ 
"不 明 性 别 好 友 : $.2f%%"% (float (other) /total* 100)) 


这 好 像 不 够 直观 ， 有 兴趣 的 读者 可 以 加 上 可 视 化 展示 , 这 里 用 基于 Python 的 可 视 化 图 




















像 库 Matplotlib， 首 先 安装 Matplotlib 库 : 


pip install matplotlib 
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展示 比例 一 般 使 用 百分比 圆 饼 表 : 


import numpy as np 

# 导 入 Matplotlib 库 

import matplotlib.mlab as mlab 
import matplotlib.pyplot as plt 
labels=['"'man','female', 'unknow'] 

















X=[ male, female, other] 
fig=plt.figure() 
plt.pie(X,1labels=labels,autopct="'%1 .2f%%") 
# 画 饼 图 数据， 数据 对 应 的 标签 ， 百 分 数 保留 两 位 小 数 点 ) 
plt.title ("Pie chart") 
plt.show() 
plt.savefig ("PieChart.jpg") 


运行 效果 如 图 7-3 所 示 。 
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图 Figwel 12 





nr| 














Pie chart 


man 


























43| 中 Ql 二 | Lam aa 





图 7-3 微 信 好 友 的 男女 比例 饼 图 
@ 统计 微 信 好 友 的 所 在 省 份 信息 到 Excel 文件 中 


def get Var (Var) : 
Variable=[] 
for i in friends: 
value=i [var] 
variable.append (value) 
return variable 
# 调 用 函数 得 到 各 变量 ， 并 把 数据 存 到 csv 文件 中 
NickName=get var ("NickName") 
Sex=get var('Sex') 
Province=get var!('Province') 


City=get var {City'y 
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Signature=get var('Signature') 

from pandas import DataFrame 

data={'NickName': NickName, 'Sex': Sex, 'Province': Province, 
'City': City, 'Signature': Signature} 

frame=DataFrame (data) 

frame.to csv('data.csv', index=True) 


全 微 信 自动 回复 
这 里 实现 一 个 类 似 QQ 上 的 自动 回复 ， 原 理 是 接收 到 消息 就 发 消息 回去 ， 同 时 发 一 条 





给 文件 助手 ， 这 样 就 可 以 在 文件 助手 中 统一 查看 消息 。 其 代码 很 简单 ， 如 下 : 


# 微 信 自动 回 复 
import itchat 
from itchat.content import * 
# 封 装 好 的 装饰 器 ， 当 接收 到 的 消息 是 Text 〈 即 文字 消息 ) 时 
Qitchat.msg register('Text') 
def text_reply(msg) : 
# 当 消息 不 是 由 自己 发 出 的 时 候 
if not msg['FromUserName']==myUserName: 
# 发 送 一 条 提示 给 文件 助手 
itchat.send msg (u"[%s] 收 到 好 友 @%s 的 信息 : $s\n" 多 
(time. strftime ("%Y-%m-%d %H:%M:%S", time.localtime (msg['CreateTime'])), 
msg['User']['NickName'],msg['Text']), 'filehelper') 
# 回 复 给 好 友 
return u' [自动 回复 ] 我 现在 不 在 , 一 会 再 和 您 联系 。\n 已 经 收 到 您 的 信息 :$s\n'% (msg['Text']) 


if _ name =='_ main _': 
itchat.auto login() 
# 获 取 自 己 的 UserName 
myUserName=itchat .get friends (update=True) [0] ["UserName"] 
itchat.run() 


@ 收 到 红包 提醒 


import itchat 
from itchat.content import * 


# 微 信 红 包 提 醒 
@itchat.msg register (NOTE,isGroupChat=True) # 监 听 群 内 红包 消息 NOTE 
def receive red packet (msg): 
if u" 收 到 红包 " in msg['Content']: 
groups=itchat.get chatrooms (update=True) 
users=itchat .search chatrooms (name='Happy 一 家 人 ' ) # 把 红包 消息 通知 给 这 个 群 
userName=users[0] ['UserName'] # 获 取 这 个 群 的 唯一 标识 ID 
for g in groups: 


if msg['FromUserName'] == g['UserName']: 
# 根 据 群 消息 的 FromUserName 匹配 是 哪个 群 
group_ name=g['NickName'] # 群 的 昵称 
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msgbody=' 有 人 在 群 "ss" 发 了 红包 ,请 立即 打 电 话 给 我 , 让 我 去 抢 ' Sgroup name 
# 提 醒 自己 有 人 在 群 里 发 红包 
itchat .send (msgbody, toUserName=myUserName) 
# 把 红包 消息 通知 给 'Happy 一 家 人 ' 群 
itchat.send (msgbody, toUserName=userName) 
itchat .auto login(True) 
# 获 取 自 己 的 UserName 
myUserName=itchat .get friends (update=True) [0] ["UserName"] 
itchat.run() 


7.3.7 ”Python 调用 图 灵机 器 人 API 实现 简单 的 
机 交互 


图 灵机 器 人 是 一 个 中 文 语 境 下 的 对 话机 器 人 ， 免 费 的 机 器 人 允许 每 天 
有 5000 次 的 调用 ， 如 果 放 在 群 聊 中 是 完全 够 用 的 (只 有 @ 的 消息 才 使 用 机 
器 人 回复 )。 图 灵机 器 人 还 有 一 些 简单 的 能 力 ， 例 如 讲 笑话 、 故 事 大 全 、 成 
语 接龙 、 新 闻 资 讯 等 。 如 果 有 好 友 发 送 “ 讲 个 笑话 吧 ” 它 就 会 自动 回复 一 
个 笑话 ， 如 果 好 友 问 “郑州 天 气 ? ” 它 就 会 自动 回复 天 气 情 况 ， 等 等 。 

下 面 介绍 如 何 简单 地 调用 图 灵机 器 人 接口 (API)。 

@ 注册 获取 APIKEY 

这 一 步 很 简单 ， 在 “http:/wwwtuling123.com” 对 应 的 网 页 上 直接 注册 一 个 账号 ， 就 
可 以 得 到 自己 的 机 器 人 APIKEY。 这 个 APIKEY 在 以 后 发 送 GET 请 求 的 时 候 需 要 用 到 。 
如 果 用 户 觉得 很 麻烦 ， 也 可 以 暂时 使 用 itchat 提供 的 几 个 KEY。 

8edce3ce905a4cldbb965e6b35c3834d 

eb720a8970964f3f855d863d24406576 


1107dq5601866433dba9599faclbc0083 
71f28bf79c820df10d39b4074345ef8c 


四 安装 requests 实现 HTTP 请 求 

在 安装 的 时 候 使 用 pip 即 可 。 

pip install requests 

全 调用 图 灵机 器 人 接口 

其 调用 也 比较 简单 ， 主 要 是 模拟 POST 请 求 ， 然 后 解析 返回 的 JSON 数据 。 用 户 可 以 
requests， 也 可 以 使 用 urllib 库 ， 但 request 简化 了 发 送 HTTP 请 求 的 步骤 。 























使 











import requests 

import urllib 

import json 

KEY="e5ccc9c7c8834ec3b08940e290ff1559" 井 换 成 自己 的 RPI KEY 
url="'http://www.tulingl23.com/openapi/api' 

Teo infoa, 讲 个 笑话 ' .encode ('utf-8') 
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query={'key': KEY, ‘info': req info} 
headers={"'Content-type': 'text/html', "charset': "utf-8"} 


方法 一 : 用 requests 模块 以 GET 方式 获取 回复 内 容 。 


req=requests.get (url, params=query, headers=headers) 
response=req.text 

data=json.1loads (response) 

print (data.get ('text')) # 或 者 data['text'] 


方法 二 : 用 urllib 库 获 取 回 复 内 容 。 


data=parse.urlencode (query) .encode ('utf-8' )# 使 用 urlencode () 方法 转换 标准 格式 
page=request .urlopen (url, data) 





html=page.read() 


html=html .decode ("utf-8") #decode () 将 网 页 的 信息 进行 解码 ， 否 则 会 出 现 乱码 
data=json.loads (html) #JSON 字典 数据 

print (data) ## 显 示 字典 数据 

Print(' 机 器 人 说 : '+ data.get('text')) # 显 示 对 话 内 容 


下 面 是 实现 在 Python 的 控制 台 下 与 图 灵机 器 人 聊天 的 例子 : 


import urllib,json 

from urllib import request 

from urllib import parse 

def getHtml (url, data): 
page=request .urlopen (url, data) 
html=page.read() 
html=html .decode ("utf-8") ”#decode () 将 网 页 的 信息 进行 解码 ， 否 则 会 出 现 乱码 
return html 

if _ name =='_ main_ _': 
key="8b005db5f57556fb96dfd98fbccfab84"' 
#url='http://www.tulingl23.com/openapi/api?key="' + key + '&info='+ info 








url='http://www.tulingl123.com/openapi/api' 
while True: 
req_info=input(" 我 : ') 
# 发 给 服务 器 数据 
query={'key': key, 'info': req info} 
data=parse.urlencode (query) .encode ('utf-8') 
# 使 用 urlencode () 方法 转换 标准 格式 
Fresponse=getHtml (url, data) 


data=json.1loads (response) # 字 典 数据 
print (data) # 显 示 字 典 数 据 
print (' 机 器 人 : '+data['text'] ) # 显 示 对 话 内 容 
运行 结果 如 下 : 
我 : he 


{'code': 100000, 'text"': ' 他 "'} 
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机 器 人 说 : 他 

我 : 讲 个 笑话 

{"'code"': 100000，"text'" : "北京 的 城管 也 是 蛮 拼 的 。 夜 里 十 二 点 多 ， 路 边 买 个 饼 吃 ， 钱 都 交 
了 ， 卖 饼 的 阿姨 被 城管 吓 跑 了 ' } 

机 器 人 说 : 北京 的 城管 也 是 蛮 拼 的 。 夜 里 十 二 点 多 ， 路 边 买 个 饼 吃 ， 钱 都 交 了 ， 卖 饼 的 阿姨 被 城管 吓 跑 了 


7.4 程序 设计 的 步骤 





读者 掌握 了 以 上 关键 技术 ， 就 可 以 轻松 开发 微 信 机 器 人 了 。 
# 加 载 库 


from itchat.content import * 
import requests 

import json 

import itchat 

itchat.auto login() 


调用 图 灵机 器 人 的 API， 采 用 扑 虫 的 原理 ， 根 据 聊天 消息 返回 回复 内 容 。 


def tuling(info): 
appkey="e5ccc9c7c8834ec3b08940e290ff1559" 
url="http://www.tuling123.com/openapi/api?key=%s&info=%s"g (appkey, info) 
req=requests.get (url) 
content=req.text 
data=json.loads (content) 
answer=data['text'] 
return answer 


对 于 群 聊 信息 ， 定 义 获取 想 要 针对 某 个 群 进行 机 器 人 回复 的 群 ID 函数 。 


def group id (name) : 
df=itchat .search chatrooms (name=name) 
return df[0] ['UserName'] 


注册 itchat 文本 消息 ， 绑 定 到 text_reply0 处 理 函 数 。 


#text reply msg files 可 以 处 理 好 友之 间 的 聊天 回复 
Qitchat.msg register([TEXT,MAP,CARD,NOTE,SHARING]) 
def text reply(msg): 
itchat.send('%s' %$ tuling(msg['Text']),msg['FromUserName']) 


注册 多 媒体 消息 ， 绑 定 到 download_files() 处 理 函 数 。 


Qitchat.msg register ([PICTURE， RECORDING, ATTACHMENT, VIDEO] ) 
def download files (msg) : 
msg['Text'] (msg['FileName']) 
return '@%s@%s' $ ({'Picture': 'img', 'Video': 'vid'}.get (msg['Type'], 
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'fil'), msg['FileName']) 


现在 微 信用 户 通 常 加 了 很 多 群 ， 但 并 不 想 对 所 有 的 群 都 设置 微 信 机 器 人 ， 只 想 对 某 些 
群 设置 微 信 机 器 人 ， 可 进行 如 下 设置 : 

Qitchat.msg register (TEXT, isGroupChat=True) 
def group text reply (msg): 

# 如 果 只 想 对 8 自己 的 人 回复 ， 可 以 设置 if msg['isAt'] 

item=group id(u' 想 要 设置 的 群 的 名 称 ') # 根 据 自 己 的 需求 设置 

if msg['FromUserName']==item: 

itchat.send(u'%s' $ tuling(msg['Text']), item) 

itchat.run() 


这 个 机 器 人 会 自动 回复 好 友和 群 聊 信 息 ， 并 将 发 来 的 图 片 等 多 媒体 信息 下 载 下 来 重新 
发 给 对 方 。 


7.5 ”开发 消息 同步 机 器 人 


有 了 开发 微 信 聊 天 机 器 人 的 经 验 之 后 ， 接 下 来 开发 微 信 消 息 同步 机 器 人 ， 微 信 消 息 同 
步 机 器 人 用 于 完成 两 个 群 信息 的 同步 〈 当 任意 一 个 群 收 到 消息 时 同步 到 其 他 另 一 个 群 )。 

其 开发 思路 是 设计 一 个 字典 groups， 用 来 存放 需要 同步 消息 的 群 聊 的 ID， 其 中 key 为 
群 聊 的 ID，value 为 群 聊 的 名 称 。 

groups={' 群 聊 的 ID' : 和 群 聊 的 名 称 ，' 群 聊 的 ID ': 群 聊 的 名 称 } 

例如 : 


groups={'@f47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff208ec03fb 
b8d', 'Happy 一 家 人 ', Qf47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff 
208ec03fbb8d，' 神 聊 谷 '} 


当 接 收 到 群 聊 消息 时 ， 如 果 消 息 来 自 于 需要 同步 消息 的 群 聊 ， 就 根据 消息 类 型 进行 处 
理 ， 同 时 转发 到 其 他 需要 同步 的 群 聊 。 

首先 定义 一 个 消息 响应 函数 ， 文 本 类 消息 可 以 用 TEXT 和 SHARING 两 类 ， 使 用 
isGroupChat=True 指定 消息 来 自 于 群 聊 ， 这 个 参数 默认 为 False。 


import itchat 

from itchat.content import * 

@itchat.msg register([TEXT, SHARING], isGroupChat=True) 

def group reply text (msg): 
# 获 取 群 聊 的 ID， 即 消息 来 自 于 哪个 群 聊 
source=msg['FromUserName'] # 群 聊 的 ID 
# 这 里 可 以 把 source 打印 出 来 ， 在 确定 是 哪个 群 聊 后 把 群 聊 的 ID 和 名 称 加 入 groups 
groups={"@f47fcf4533413b5fad998e30459a86866623c68cb6a363c7aeff208ec03 
fbb8d', ' Happy 一 家 人 ', @f47fcf4533413b5fad998e30459a86866623c68cb6a363c7 
aeff208ec03fbb8d，' 神 聊 谷 '} 
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| 这 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


# 处 理 文本 消息 
if msg['Type']==TEXT: 
# 消 息 来 自 于 需要 同步 消息 的 群 聊 
if source in groups:# 判 断 是 否 在 字典 里 ， 等 价 于 2.7 版 本 中 的 groups.has_key (source) 
for item in groups.keys() : # 转 发 到 其 他 需要 同步 消息 的 群 聊 


if not item==source: 
#groups[source] : 消息 来 自 于 哪个 群 聊 
#msg['ActualNickName'] : 发 送 者 的 名 称 
#msg['Content']: 文本 消息 内 容 
#item: 需要 被 转发 的 群 聊 ID 
itchat.send('%s: $s\n%ss' %$ (groups[source], msg['ActualNickName'], 
msg['Content']), item) 
# 处 理 分 享 消息 
elif msg['Type']==SHARING: 
if groups.has key(source) : 
for item in groups.keys() : 
if not item==source: 
#msg['Text'] : 分 享 的 标题 ,msg['Url1'] : 分 享 的 链接 


itchat.send('%s: %sN\ngss\ngss' % (groups[source], msg['ActualNickName'], 


msg['Text'], msg['Url']), item) 
再 来 处 理 一 下 图 片 等 多 媒体 类 消息 。 
# 处 理 图片 和 视频 类 消息 


Qitchat.msg register([PICTURE, VIDEO], isGroupChat=True) 
def group reply media (msg): 
source=msg['FromUserName'] 
下 载 图 片 或 视频 
msg['Text'] (msg['FileName']) 
if groups.has key(source) : 
for item in groups .keys() : 
if not item==source: 
# 将 图 片 或 视频 发 送 到 其 他 需要 同步 消息 的 群 聊 
itchat.send('@%s@%s' % ({'Picture': 'img', 'Video': 'vid'}.get (msg['Type'], 
'fil'), msg['FileName']), item) 
itchat.auto login(True) 
itchat .run() 


以 上 代码 实现 了 对 文本 、 分 享 、 图 片 、 视 频 4 类 消息 的 处 理 ， 如 果 用 户 对 其 他 类 型 的 
消息 也 感 兴趣 ， 进 行 相应 的 处 理 即 可 。 目 前 两 个 群 之 间 可 以 进行 消息 的 同步 了 ， 一 群 和 二 
群 的 用 户 之 间 终 于 可 以 畅快 地 聊 起 来 。 
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8.1 微 信 网 页 版 机 器 人 功能 介绍 


微 信 网 页 版 是 腾讯 公司 开发 的 微 信 官 方 工具 ， 能 够 在 计算 机 网 页 上 使 用 微 信 ， 微 信 网 
页 版 基于 Https 请 求 ， 通 过 API 的 形式 与 微 信 服务 器 进行 数据 交互 ， 所 有 的 协议 均 暴 露 ， 
可 通过 浏览 器 抓 包 工具 进行 获取 和 分 析 。 

目前 国内 流行 的 浏览 器 (例如 Chrome 浏览 器 、FireFox 浏览 器 ) 均 带 有 开发 者 工具 ， 
用 户 通过 网 络 请 求 面板 可 以 详细 地 看 到 整个 微 信 网 页 版 在 运行 过 程 中 涉及 的 所 有 API 请 
求 。 本 章 根据 上 述 获取 到 的 请 求 模拟 微 信 网 页 版 的 流程 。 

首先 对 微 信 网 页 版 的 整体 运行 流程 进行 分 析 , 使 用 Python 语言 模拟 微 信 网 页 版 的 运行 
流程 ， 实 现 登 录 、 获 取 好 友信 息 、 发 送 消息 等 基础 操作 ， 并 在 上 述 基础 之 上 实现 一 些 扩展 
操作 ， 例 如 自动 确认 好 友 请 求 、 定 时 发 送 消息 、 检 测 好 友 状 态 、 自 动 邀 请 好 友 加 入 群 聊 等 。 

通过 对 微 信 网 页 版 协议 进行 分 析 ， 读 者 对 API 中 的 请 求 参 数 、 请 求 方式 、 返 回 值 等 加 
深 了 理解 ， 这 对 后 续 的 实际 开发 有 很 多 值得 借鉴 的 地 方 ， 能 够 清晰 地 了 解 微 信 网 页 版 的 整 
体 运 行 流程 ， 扩 展 自己 的 思维 。 另 外 ， 在 扩展 个 人 微 信号 的 同时 也 能 很 好 地 练习 Python 基础 ， 
这 对 学 习 网 络 怜 虫 等 有 很 大 的 帮助 意义 。 


8.2 ” 微 信 网 页 版 机 器 人 设计 思路 
8.2.1 分 析 微 信 网 页 版 API 


本 章 以 Chrome 浏览 器 为 例 讲 解 如 何 抓 包 分 析 微 信 网 页 版 API， 步 又 如 下 : 








| 党 要 项 目 案例 开发 





从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


@ 打开 开发 者 工具 
首先 打开 Chrome 浏览 器 ， 然 后 打开 开发 者 工具 ， 如 图 8-1 所 示 。 





女 | 图 加 





Pp 





图 8-1 打开 开发 者 工具 





切换 到 Network 界面 ， 如 图 8-2 所 示 。 

















图 8-2 切换 到 Network 界面 


勾 选 Preserve log 复 选 框 ， 否 则 在 跳 转 之 后 无 法 查看 之 前 的 请 求 信息 。 

提示 : 对 于 Chrome 开发 者 工具 的 使 用 小 技巧 ， 读 者 可 以 在 网 址 “http://blog.csdn.net/ 
Letasian/article/details/78461438” 对 应 的 页 面 中 查看 。 

四 打开 微 信 网 页 版 


在 浏 


览 器 中 输入 网 址 (https://wx.qq.com)， 打 开 微 信 网 页 版 。 在 左 侧 URL 列表 中 可 以 


看 到 以 jslogin 开始 的 网 址 ， 该 URL 即 为 获取 登录 所 需 二 维 码 的 API 请 求 。 
在 图 8-3 中 ， 左 侧 为 所 有 的 请 求 ， 单 击 某 一 个 请 求 后 右 侧 会 出 现 该 请 求 的 详细 信息 。 
General 中 为 请 求 的 URL (Request URL) 和 请 求 方式 (Request Method)， 常 见 的 请 求 
方式 有 GET 和 POST。Response Headers 为 响应 头 信 息 ，Request Headers 为 请 求 头 信息 ， 


包括 常用 





J User-Agent、Host、Reterer、Cookie 寺 ， lery String Parameters 人 y 硼 
的 User-Ai Host、Ref Cookie 等 ，Query String Pi 为 请 求 URL 


中 的 参数 信息 。 
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图 8-3 分 析 URL 


单 击 右 侧 的 Response 标签 ， 可 以 看 到 格式 如 “window.QRLogin.code=200; window. 
QRLogin.uuid=" QZNW7IsSPLg== ";:” 的 内 容 ， 其 中 window.QRLogin.code 代表 该 请 求 发 送 
成 功 ，window.QRLogin.uuid 中 的 内 容 为 当前 登录 所 需要 的 二 维 码 信 息 ， 将 该 uuid 传 入 获 
取 二 维 码 的 URL 中 即 可 获取 到 二 维 码 的 图 片 。 

加 API 总 结 

根据 上 述 过 程 可 以 得 知 该 URL(https://login.wx.qq.com/jslogin?appid=wx782c26e4cl9ac 
ffb&redirect_uri=https%3A%2F%2FWx.qq.com%2Fcgi-bin%2Fmmwebwx-bin%2Fwebwxnewl 
oginpage&fun=new&lang=zh CN& =1521355811687) 即 为 获取 登录 所 需 二 维 码 的 API， 请 
求 方式 为 GET， 其 中 参数 列表 中 的 appid 为 微 信 开 放 平 台 注册 的 应 用 的 AppID,“_” 为 当 
前 时 间 的 13 位 毫秒 值 。 

其 余 参 数 均 固 定 ， 如 下 。 

® redirect uri: https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage。 

。 fun: new。 

。 lang: zh _ CN, 

注 : appid 就 是 在 微 信 开 放 平 台 注册 的 应 用 的 AppID。 网 页 版 微 信 有 两 个 AppID， 早 
期 的 是 wx782c26e4c19acffb， 在 微 信 客 户 端 上 显示 的 应 用 名 称 为 Web 微 信 ; 现在 用 的 是 
wxeb7ec651dd0aefa9， 显 示 的 名 称 为 微 信 网 页 版 。 

根据 上 述 分 析 ， 可 以 将 此 API 归纳 为 表 8-1。 


表 8-1 获取 登录 所 需 的 二 维 码 
获取 登录 所 需 的 二 维 码 

https://login.wx.qq.com/jslogin 
GET 
appid: wx782c26e4c19acffb 
redirect_uri: https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage 
fun: new 
lang: zh CN 
_: 时 间 惟 
window.QRLogin.code=200; window.QRLogin.uuid="0ZOD 53KKw—": 

















157 | 








ps 项 目 案例 开发 

















从 入 门 到 实战 一 旋 虫 、 游 戏 和 机 器 学 习 
其 余 API 的 分 析 方 法 与 之 类 似 ， 此 处 不 再 一 一 介绍 。 


8.2.2 API 汇总 


下 面 API 列表 中 的 参数 均 为 举例 ， 在 实际 运行 中 很 多 都 是 动态 的 ， 需 要 用 户 自 定义 传 
入 ， 返 回 值 也 为 样 例 ， 对 于 部 分 过 长 的 有 删 减 ， 不 再 一 一 指出 。 



































@ 显示 二 维 码 
显示 二 维 码 如 表 8-2 所 示 。 
表 8-2 显示 二 维 码 
描述 显示 二 维 码 
地 址 https://login.weixin.qq.com/qrcode/ {uuid} 
请 求 类 型 GET 
请 求 参数 无 
返回 值 图 片 二 进 制 流 





@ 等 待 扫描 二 维 码 
等 待 扫描 二 维 码 如 表 8-3 所 示 。 

















表 8-3 “等待 扫描 二 维 码 


等 待 微 信 手机 客户 端 扫 描 二 维 码 
https://login.wx.qq.com/cgi-bin/mmwebwx-bin/login 
GET 
loginicon: true 
Uuid: XXXX 
tip: 0 为 未 扫描 ，1 为 已 扫描 
TI: (-940126109)， 毫 秒 值 取 反 
_: 1494054830403， 时 间 惟 
window.code=xxx; 
xxx: 408 表示 登录 超时 ;，201 表示 扫描 成 功 ，200 表示 确认 登录 
当 code 为 200 时 数据 包括 跳 转 地 址 ， 例 如 “window.redirect_uri="https://wx2.qq. 
com/cgi-bin/mmwebwx-bin/webwxnewloginpage?ticket=AwglwtXTXfw9oQgP9jslV 1lig@ 
i ” 需要 将 ticket 参 


@ 登录 获取 Cookie 
登录 获取 Cookie 如 表 8-4 所 示 。 


请 求 参数 





表 8-4 登录 获取 Cookie 
登录 成 功 后 获取 Cookie 信息 

https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxnewloginpage 
GET 
ticket: AwglwtXTXfw9oQgP9jslV1lig@qrticket 0 
uuid: 4VCtDVBOg— 
lang: zh CN 
scan: 1494055480 
fun: new 
version: V2 
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续 表 
登录 成 功 后 获取 Cookie 信息 




















<error> 
<ret>0</ret> 
<message></message> 
<skey>@crypt_522d8a57 60a7646e99d8f25b230</skey> 
<wxsid>VOXSzwUSINcrbor8</wxsid> 
<wxuin>2929094227</wxuin> 
<pass_ ticket>aGK4HWSoVzFoQscFt2hO%2Fy</pass_ticket> 
<isgrayscale>1</isgrayscale> 

</error> 


四 微 信和 初始 化 
微 信和 初始 化 如 表 8-5 所 示 。 


返回 值 








表 8-5 ” 微 信和 初始 化 
微 信 初始 化 

https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxinit 
POST 

JSON 

Content-Type: application/jsol 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx } 
} 

{ 





charset=UTF-8 


"BaseResponse": { "Ret": 0, "ErrMsg": "" }, 
"Count": 11, 
"ContactList": [...], 
"SyncKey": { 
"Count": 4, 
“List": [ 
{ 
“Key 1, 
"Val": 635705559 


}), 

“User": { 
"Uin": xxx, 
"UserName": xxx, 
"NickName": xxx, 


}, 


"ChatSet": xxx, 
"SKey": xxx, 
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| 辐 有 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


续 表 
描述 微 信 初 始 化 





"ClientVersion": 369297683, 
"SystemTime": 1453124908, 
"TnviteStartCount": 40, 

返回 值 "MPSubscribe MsgCount": 2, 
"MPSubscribeMsgList": [...], 
"ClickReportInterval": 600000 





@ 开启 手机 状态 通知 
开启 手机 状态 通知 如 表 8-6 所 示 。 


表 8-6 ”开启 手机 状态 通知 
描述 开启 手机 微 信 客户 端 状态 通知 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxstatusnotify 
请 求 类 型 POST 
参数 类 型 JSON 








请 求 头 Content-Type: application/json; charset=UTF-8 
{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
Code: 3, 

请 求 参数 FromUserName: 自己 的 ID， 


ToUserName: 自己 的 ID， 
ClientMsgId: 时 间 惟 





} 
{ 
层 辐 "BaseResponse": {"Ret": 0,"ErrMsg": ""}, 
返回 数据 "MsgID": "1848761205298770623" 
@ 获取 联系 人 列表 


获取 联系 人 列表 如 表 8-7 所 示 。 
表 8-7 获取 联系 人 列表 














描 述 获取 联系 人 列表 
地 址 https://wx2.qq.com/cgi-bin/ mmwebwx-bin/webwxgetcontact 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: application/json: charset=UTF-8 
{ 
请 求 参 数 BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx} 
} 
{ 
"BaseResponse": { 
“Ret :0 
"ErMsg": m 
返回 数据 } 











"MemberCount": 334, 
"MemberList": [ 


"Uin": 0, 
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续 表 


Ed 
网 


获取 联系 人 列表 





"UserName": XXX. 
"NickName": "Urinx", 





返回 数据 





s 








下 
"Seq": 0 





@ 获取 指定 联系 人 详细 信息 
获取 指定 联系 人 详细 信息 如 表 8-8 所 示 。 


表 8-8 获取 指定 联系 人 详细 信息 





























获取 指定 联系 人 详细 信息 
https://wx2.qq.com/cgi-bin/ mmwebwx-bin/webwxbatchgetcontact 
POST 
JSON 
Content-Type: application/json; charset=UTF-8 
{"BaseRequest": { 
"Uin": 2929094227, 
"Sid": "VOXSzwUSINcrbor8", 
"Skey": "@crypt_522d8a57_68f25b230", 
"DeviceID": "e586776133027541" 
入 
;二 求 和 "Count": 1, 
请 求 参 数 "List": [ 
"UserName": "(0591768165ac0c9b8326bbe1355", 
"EncryChatRoomId": "@@62ea4eba9ecd4a8111327b7cb" 
站 
] 
} 
{ 
"BaseResponse": { 
"Ret": 0, 
"ErMsg": "" 
}, 
"Count": 1, 
"ContactList": [ 
{ 
"Uin": 0, 
返回 数据 "UserName": "(059176816542bb0c9b8326bbe1355", 
"NickName": "路 人 甲 ", 
"HeadImgUrl": "/cgi-bin/mmwebwx-bin/webwxgeticon?seq=0&username= 
(@591755&chatroomid=(@6a8f2&skey=", 
"ContactFlag": 0, 
} 
] 
3 
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| 全 本 项 目 案例 开发 





从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


@ 检查 新 消息 
检查 新 消息 如 表 8-9 所 示 。 


表 8-9 检查 新 消 


























描 述 检查 新 消息 

地 址 https://webpush2.weixin.qq.com/cgi-bin/mmwebwx-bin/synccheck 

请 求 类 型 GET 

参数 类 型 JSON 

请 求 头 Content-Type: application/json: charset=UTF-8 
: 

请 求 参 数 BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx } 
window.synccheck={retcode:"xxx",selector:"xxx"} 

返回 值 retcode: 0 为 正常 ，1100 表示 失败 /退出 微 信 ; 1101 表示 在 其 他 地 方 登录 Web 版 微 信 ; 
1102 表示 在 手机 上 主动 退出 
selector: 0 为 正常 ，2 表示 新 的 消息 ;6 表示 联系 人 信息 变更 ;7 表示 进入 /离开 聊天 界面 

@@ 获取 新 消息 


获取 新 消息 如 表 8-10 所 示 。 

















表 8-10 ”获取 新 消息 





描述 获取 新 消息 
地 址 https://wx2.qq.comycgi-bin/mmwebwx-bin/webwxsync 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: application/json; charset=UTF-8 
{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
请 求 参 数 SyncKey: xxx, 
I: 时 间 戳 取 反 
{ "BaseResponse' {ErrMsg': ", 'Ret': 0}, 
'SyncKey': { 'Count': 7, 
'List': [{"Val': 636214192, Key': 1}, ] 
} 'ContinueFlag': 0, 
'AddMsgCount': 1, 
'AddMsgList': [{ 
'FromUserName': ", 
返回 什 'RecommendInfo': {...}, 
'Content: "", 
}, 
J 
} 
人 @ 发 送 文本 消息 


发 送 文本 消息 如 表 8-11 所 示 。 
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表 8-11 发 送 文 本 消息 








描 述 发 送 文本 消息 
地 址 https://wx2.qq.com/cgi-bin/mmwebwx-bin/webwxsendmsg 
请 求 类 型 POST 
参数 类 型 JSON 
请 求 头 Content-Type: application/json: charset=UTF-8 
{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
Msg: { 
Type: 1 文字 消息 ， 
Content: 要 发 送 的 消息 ， 
请 求 参 数 FromUserName: 自己 的 ID， 
ToUserName: 好 友 的 ID， 
LocalID: 与 clientMsgId 相同 ， 
ClientMsgId: 时 间 惟 左 移 4 位 随后 补 上 4 位 随机 数 
} 
返回 值 {"BaseResponse": { "Ret": 0, "ErrMsg": ""}} 





人 @ 发 送 图 片 消息 
发 送 图 片 消 息 如 表 8-12 所 示 。 





表 8-12 发 送 图 片 消息 
发 送 图 片 消息 
https://wx2.qq.com/cgi-bin/ mmwebwx-bin/webwxsendmsgimg 
POST 
JSON 
Content-Type: application/json: charset=UTF-8 
{ 
BaseRequest: { Uin: xxx, Sid: xxx, Skey: xxx, DeviceID: xxx }, 
Msg: { 
Type: 3 图 片 消息 ， 
Mediald: 图 片上 传 后 的 媒体 JD， 








请 求 参数 FromUserName: 自己 的 ID， 
ToUserName: 好 友 的 了 D， 
LocalID: 与 clientMsgId 相同 ， 
ClientMsgId: 时 间 惟 左 移 4 位 随后 补 上 4 位 随机 数 
上 
上 
返回 值 {"BaseResponse": { "Ret": 0, "ErrMsg": ""}} 
注 : 非 文本 消息 ， 例 如 图 片 、 语 音 、 视 频 、 表 情 等 ，API 类 似 ， 均 是 先 通过 上 传 文件 获取 媒体 ID， 
然后 发 送 此 媒体 DD。 
@ 获取 头像 


获取 头像 如 表 8-13 所 示 。 
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表 8-13 ”获取 头像 





描述 获取 头像 
地 址 https://wx.qq.comycgi-bin/mmwebwx-bin/webwxgeticon 
请 求 类 型 GET 
seq: 数字 
请 求 参数 usemame: 用 户 ID 
Skey: XXX 
返回 值 二 进 制 

















注 : 获取 好 友 、 群 头像 等 API 类 似 。 


图 获取 图 片 消 息 
获取 图 片 消 息 如 表 8-14 所 示 。 


表 8-14 ”获取 图 片 消息 
获取 图 片 消 息 
https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxgetmsgimg 
GET 

msgid: 消息 ID 
username: 用 户 ID 

type: slave 缩 略 图 ， 为 空 时 加 载 原 图 


Skey: XXX 























返回 值 
注 : 获取 语音 、 视 频 、 表 情 等 消息 类 似 ， 无 type 参数 。 


8.2.3 其 他 说 明 


@ 账号 类 型 介绍 
账号 类 型 如 表 8-15 所 示 。 
表 8-15 账号 类 型 





类 型 说 明 
个 人 账号 以 “@” 开 头 ， 后 面 由 32 位 数字 和 字母 组 成 
群 聊 以 “@@” 开 头 ， 后 面 由 32 位 数字 和 字母 组 成 
以 “@” 开 头 , 但 其 VerifyFlag & 8 !=0 
VerifyFlag: 
公众 号 /服务 号 一 般 个 人 公众 号 /服务 号 : 8 
一 般 企业 的 服务 号 : 24 
微 信 官 方 账号 微 信 团 队 : 56 
像 文件 传输 助手 之 类 的 账号 ， 它 们 有 特殊 的 ID， 目 前 已 知 的 有 filehelper、newsapp、 
fmessage、weibo、qqmail、tmessage、qmessage、qqsync、floatbottle、lbsapp、shakeapp、 
特殊 账号 medianote、qqfriend、 readerapp、blogapp、 facebookapp、masssendapp、meishiapp、feedsapp、 


voip 、 blogappweixin 、 weixin 、 brandsessionholder 、 weixinreminder 、 officialaccounts 、 
notification messages、wxitil、userexperience alarm、notification messages 





例如 测试 发 送 消息 ， 可 将 接收 和 人 〈ToUserName) 指定 为 flehelper (文件 传输 助手 ) 进 
行 测试 。 
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@ 消息 类 型 介绍 
微 信 中 消息 的 格式 一 般 如 下 : 


{ 
"FromUserName™": ""， 
"ToUserName": ""， 
"oontent®: ww # 内 容 
"StatusNotifyUserName": "", 
"ImgWidth": 0, 
"PlayLength": 0, 
"RecommendInfo": {...}, 
"statusNotifyCode": 4, 
"NewMsgId": "™", 
"Status™ 3 
"VoiceLength": 0, 
"ForwardFlag": 0, 
"AppMsgType": 0, 
a 
APDLNLO®S Ne 
ht lh 
"ImgStatus": 1, 
"Msgrype"s 1, 
"ImgHeight": 0, 
Medialde ee 
"MsgId": 和 
"FileName": 
"HasProductId": 0, 
ei 六 地 -六 二 = 个 
"CreateTime": 1454602196, 
"SubMsgType": 0 








} 


其 中 经 常用 到 的 字段 有 FromUserName (发 送 人 ID)、ToUserName (接收 入 ID )、Content 
(内 容 )、MsgId (消息 ID)、MsgType (消息 类 型 ) 等。 微 信 中 的 部 分 消息 类 型 如 表 8-16 
所 示 。 


表 8-16 ” 微 信 中 的 消息 类 型 





























类 型 说 ” 明 
1 文本 消息 
3 图 片 消息 
34 语音 消息 

37 好 友 确 认 消 息 
43 视频 消息 
48 位 置 消息 
49 分 享 链接 
10000 系统 消息 
10002 撤回 消息 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

当 MsgType=1l 时 , 用 户 只 需要 获取 Content 字段 即 可 获取 消息 内 容 , 当 MsgType=3 时 ， 
获取 Mediald 字段 ， 将 Mediald 传 入 获取 文件 接口 ， 即 可 下 载 此 图 片 消息 。 语 音 、 视 频 等 
消息 的 获取 与 此 类 似 。 


8.3 程序 设计 的 步骤 





8.3.1 微 信 网 页 版 的 运行 流程 


从 上 述 微 信 网 页 版 API 的 分 析 过 程 可 以 得 出 微 信 网 页 版 的 运行 流程 ， 如 图 8-4 所 示 。 


获取 UUID 获取 联系 人 开启 状态 通知 
、 | 
获取 二 维 码 
| 
登录 向 信 初 始 化 
f 
下 非 空 
Pe 
1 
3 确认 登录 跳 转 页 面 同步 消息 


图 8-4” 微 信和 网 页 版 的 运行 流程 




































































(1) 打开 微 信 网 页 版 《https://wx.qq.com)， 获 取 随 机 的 UUID。 

(2) 根据 第 1 步 获 得 的 UUID 获取 登录 所 需 扫描 的 二 维 码 图 片 。 

(3) 使 用 微 信 移动 客户 端 扫描 该 二 维 码 ， 检 测 用 户 是 否 已 经 扫 码 。 

(4) 扫描 二 维 码 成 功 后 ， 检 测 用 户 是 否 单 击 确认 登录 。 

(5) 确认 登录 后 ， 跳 转 新 页 面 ， 调 用 初始 化 API。 

(6) 调用 开启 手机 状态 通知 API， 获 取 联 系 人 列表 。 

(7) 循环 执行 同步 检测 ， 待 收 到 响应 后 继续 发 起 下 一 个 请 求 。 此 时 根据 返回 数据 的 内 
容 判 断 是 否 需 要 拉 取 消息 、 自 动 退出 等 操作 。 

注 : 目前 微 信 网 页 版 更 新 出 账号 记录 功能 ， 用 户 在 登录 时 可 根据 之 前 的 账号 信息 实现 
免 扫 码 ， 直 接 在 微 信 移动 客户 端 单 击 确认 登录 。 本 程序 未 实现 此 功能 ， 感 兴趣 的 读者 可 以 
自行 实现 。 
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8.3.2 ”程序 目录 


本 系统 的 程序 文件 目录 如 下 : 
上 一 wechat_bot 项 目 目录 
上 一 wechat botpy ”程序 入 
上 一 thread pool 线程 相关 包 
上 一 send msg thread.py 发 送 消息 线程 
上 -一 Wechat 微 信 相 关 包 
上 一 wechat_ msg _ processorpy 消息 处 理 
上 一 wechatpy 模拟 微 信 运行 类 〈 继 承 wechat api) 
上 一 wechat apispy ”基础 协议 (包括 所 有 API 抽象 的 函数 ) 
上 一 base ”基础 包 
上 一 config managerpy 读 取 配置 文件 
上 一 logpy ”日 志 
上 一 utilspy ”常用 工具 
上 一 constantpy 相关 常量 
上 一 wechat.conf.bak 基础 配置 文件 
上 一 data 运行 数据 
| 一 1001 ”机 器 人 编号 
上 一 Logs 日 志 
上 一 Data 文件 
上 一 msgs 消息 
一 users 好 友 头 像 
上 一 rooms 群 聊 头像 
上 一 upload 上 传 文件 
注 : 本 程序 实现 了 一 台 机 器 同时 运行 多 个 微 信 机 器 人 ， 启 动 时 使 用 如 下 命令 : 
python wechat bot.py 1001 


其 中 ，1001 为 机 器 人 编号 (数字 类 型 )， 不 同 机 器 人 的 数据 位 于 不 同 的 目录 下 。 

此 时 会 根据 wechat.conf.bak 配置 文件 的 内 容 复 制 生 成 wechat 1001.conf 文件 ， 如 果 遇 
到 部 分 机 器 人 需要 修改 配置 文件 的 内 容 ， 只 需 修 改 对 应 编号 的 配置 文件 即 可 ， 不 会 影响 其 
他 机 器 人 。 


8.3.3 微 信 网 页 版 运行 代码 的 实现 
@ 获取 随机 UUID 的 代码 


获取 随机 UUID 的 函数 包括 构造 请 求 参 数 ， 使 用 Request 发 送 POST 请 求 ， 在 返回 值 
中 使 用 正则 表达 式 截取 code 和 uuid， 并 将 uuid 设置 到 变量 中 。 
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def getuuid(self) : 


获取 登录 需要 的 UUID 


:return: True or False 


Ey 
url=self.wx conf['API jsLogin'] 
params={ # 构 造 请 求 参 数 
"appid': self.appid, 
"fun': "new' 
"Lang": self.wx conf['LANG'], 
"': int(time.time()), 
'redirect uri': self.wx conf['API jslogin redirect url'], 
} 
data=post (url, params, False) # 发 送 POST 请 求 
regx=r'window.QRLogin.code=(\d+); window.QRLogin.uuid="(\S+?)"" 
pm=re.search (regx, data) # 正 则 截取 
if pm: 


code=pm.group (1) 
self.uuid=pm.group (2) 
return code=—"200” 
return False 
except: 
self.Log.error (traceback.format exc()) 


四 结合 qrcode 生成 二 维 码 并 实现 控制 台 输 出 
使 用 qrcode 包 实 现 将 二 维 码 转化 为 黑白 格 输出 在 控制 台 , 如 果 IDE 为 白色 背景 ， 需 : 
将 BLACK 和 WHITE 的 内 容 互 换 。 


def genqrcode (self): 


在 控制 台 输 出 二 维 码 
:return: 
mm 
str2qr terminal (self.wx conf['API qrcode'] + self.uuid) 
def str2qF terminal (text): 
qr=qrcode .QRCode () 
qr.border=1 
qr.add data (text) 
mat=qr.get matrix() 
print qr (mat) 
def print qF (mat) : 
for i in mat: 
BLACK="'\033[47m \033[0m'" 
WHITE="\033[40m \033[0m'" 
Print('' .join([BLRACK if j else WHITE for j in i])) 
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EE: 





注 : 因 微 信 网 页 版 的 运行 过 程 涉及 的 流程 过 多 ， 代 码 过 长 ， 此 处 不 再 一 一 列 出 ， 读 者 
可 根据 下 面 调度 函数 的 执行 直接 查看 对 应 代码 。 
四 运行 流程 调度 函数 


def start (self): 
self.Log.info(Constant .LOG MSG START) # 记 录 机 器 人 运行 








dl=datetime .now() # 启 动 时 间 
flag=True 
while True: 
d2=datetime.now() # 当 前 时 间 
d=d2 = dl 
if d.seconds > 240: # 超 过 240 秒 未 扫 码 自动 结束 进程 
os.system(Constant .LOG MSG KILL PROCESS % os.getpid()) 
1f flag: 


run (Constant .LOG MSG GET UUID, self.getuuid)# 获 取 二 维 码 
self.Log.info(Constant .LOG MSG GET QRCODE) ## 记 录 获 取 二 维 码 


self.genqrcode () # 打 印 二 维 码 
self.Log.info(Constant.LOG MSG SCAN QRCODE) ， 间 记录 需要 扫描 二 维 码 
flag=False 


dl=datetime.now() 

tm=int (time .time()) 

if not self.waitforlogin (tm=tm) :# 等 待 确认 
self.Log.info(time.strftime ("%Y-%m-%d %H:%M:%S")) 
continue 


self.Log.info(Constant.LOG MSG CONFIRM LOGIN) 


break 
Fun (Constant .LOG MSG LOGIN, self.1login) # 登 录 
run(Constant.LOG MSG INIT, self.webwxinit) # 初 始 化 


run (Constant.LOG MSG STRATUS NOTIFY，self.webwxstatusnotify)# 开 启 状 态 通知 
run (Constant .LOG MSG GET CONTACT, self.get contact) # 获 取 联 系 人 
self.Log.info(Constant.LOG MSG CONTACT COUNT % ( 
self.MemberCount, len(self.MemberList) 
)) # 记 录 好 友信 息 
self.Log.info(Constant.LOG MSG OTHER CONTACT COUNT % ( 
len(self.GroupList), len(self.ContactList), 
len (self.SpecialUsersList)，1len(self.PublicUsersList) 
jo # 记 录 群 聊 、 特 殊 账 号 信息 
run (Constant -LOG MSG GET GROUP MEMBER, self.fetch group contacts)# 获 取 群 成 员 
ret=self.send text ('filehelper'， "我 上 线 了 ...") # 发 送 上 线 消息 
self.Log.info (ret) 


gc.collect () # 回 收 垃圾 
self.Log.info("groups number: %d" % len (self.GroupList) ) 
self.init thread () # 初 始 化 线程 
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while True: 
[retcode, selector]=self.synccheck() # 检 测 新 消息 
self.Log.debug('tag:%5s, retcode: %5, selector: %s" % (self.tag, 
retcode, selector)) 
self.exit code=int (retcode) 
if retcode 一 '1100' : 
self.Log.info(Constant.LOG MSG LOGOUT) 
break 
if retcode=="'1101': 
self.Log.info(Constant.LOG MSG LOGIN OTHERWHERE) 
break 
if retcode=='1102': 
self.Log.info(Constant.LOG MSG QUIT ON PHONE) 
break 
elif retcode=="'0"': 
if selector=="'0': 
time.sleep (self.time out) 
Slsee 
r=self .webwxsync () # 获 取消 息 
if r is not None: 
try 
self.handle mod(r) # 处 理 联 系 人 变更 
self.handle msg(r) # 处 理 消息 
except Exception as ex: 
self.Log.info(r) 
self.Log.error (traceback.format exc()) 
else: # 未 知 状态 
r=self .webwxsync () 
self.Log.debug('sync check error webwxsync: %s\n' % json.dumps (r)) 


8.4 扩展 功能 
8.4.1 自动 回复 


自动 回复 分 为 关键 词 回复 和 普通 话语 回复 ， 实 现 逻 辑 是 在 程序 启动 时 初始 化 关键 词 字 
典 ， 其 中 key 为 关键 词 内 容 进行 md5 加 密 ，value 为 要 回复 的 内 容 。 当 收 到 好 友 消 息 后 ， 
在 关键 词 字典 中 检测 是 否 有 对 应 的 键 ， 若 存在 ， 则 自动 回复 该 内 容 ;， 对 于 不 在 关键 词 中 的 
话语 ， 则 将 好 友 发 送 的 话语 作为 内 容 ， 调 用 第 三 方 机 器 人 获取 返回 值 进行 回复 。 
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本 程序 使 用 图 灵机 器 人 的 API 实现 对 话 ， 对 于 图 灵机 器 人 的 相关 内 容 ， 请 读者 查看 其 
官方 文档 ， 网 址 为 “https://www.kancloud.cn/turing/web_api/522989”。 














@ 初始 化 关键 词 字 典 

Self.keyword reply={ # 初 始 化 关键 词 
get_mqd5 value (" 你 好 ") : "我 很 好 ， 你 呢 ? "， 
get md5 value (" 你 是 谁 ") : "我 是 可 爱 的 GeekBot!"， 


} 


注 ， 本 程序 直接 初始 化 了 字典 ， 在 实际 开发 中 为 了 方便 管理 可 使 用 数据 库 管 理 。 
@ 封装 调用 图 灵机 器 人 API 函数 


def call tuling(self, text, user id=None) : 


调用 图 灵机 器 人 
:param text: 消息 内 容 
:param user_id: 用 户 唯一 标识 ， 用 于 上 下 文 
:return: 回复 的 内 容 
msg={ #RPI 所 需 参数 
'key': Constant .TULING API KEY, #key 
rnto"e textr # 内 容 
"userid': user id ， # 用 户 唯 一 标识 





} 
res=post (Constant .TULING API URL, msg) 
if res: 
if int(res['code'])==100000: 
return res['text'] 
elif int(res['code'])==200000: 
return res['text'] + '\r' + res['url'] 
SLga: 
return res['text'] 
else: 异常 
return Constant.TULING NOT RES 提 " 我 不 知道 你 在 说 些 什么 ， 换 个 话题 吧 . . ." 


全 自动 回复 实现 


if get md5 value (content) in self.wechat.keyword reply:# 判 断 是 否 存 在 该 关键 词 
text=self .wechat .keyword reply[lget md5 value (content)] 
elif content.startswith('msgs/'): 
tezxt=' 天 哪 ， 我 还 不 能 处 理 非 文 本 消息 ~' 
else: # 不 存在 调用 图 灵机 器 人 API 
text=self.call tuling(content, get md5 value (user['NickName'])) 
data={ 
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nmsgTYPe": 1, 
"data": text 


} 
t=random.uniform(1, 4) # 随 机 休 卢 一 定 的 时 间 再 回复 


time.sleep (t) 
self.send msg(data，user['UserName']) # 发 送 消息 
self.Log.info('to:%s,send:%$s' $ (user['NickName'], text)) # 记 录 发 送信 息 
@ 发 送 文本 消息 函数 
def webwxsendmsg (self, word, to='filehelper'): 
mm 
发 送 消息 
:param word: 消息 内 容 
:param to: 接收 人 ID 
:return: Dict or None 
mm 
dic=None 
flag=0 
while flag < 2: # 出 错 会 进行 一 次 重 发 
FE 
url=self.wx conf['API webwxsendmsg'] + \ 
"?pass ticket=%s' % (self.pass ticket) 
clientMsgId=str (int (time.time() * 1000)) + \ 
str (random.random()) [:5] .replace('.', '') 


params={ 
'BaseRequest': self.get base request ()， 
SG 和 
yee dy 


"Content": word, 
"FromUserName": self.User['UserName']， 
"ToUserName": to, 
"LocalID": clientMsgId, 
"ClientMsgId": clientMsgId 

]}v 

“Scene :0 


} 
headers={'content-type': 'application/json; charset=UTF-8"'} 


return post (url, params, True, headers) 
except: 
LF lcs 
self.Log.info(dic) 
Elag=flag + 入 
self.Log.error (traceback.format exc()) 


return None 
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其 实现 效果 如 图 8-5 所 示 。 


加 我 很 好 ， 你 呢 ? 


郑州 : 周 日 04 月 01 日 ,多 云 转 


晴 南 风 微风 ,最 低 气温 14 
度 ， 最 高 气温 30 度 





图 8-5 自动 回复 演示 


8.4.2 群发 消息 、 定 时 发 送 消息 、 好 友 状 态 检测 


对 于 个 人 微 信 用 户 而 言 ， 在 节日 时 经 常会 群发 消息 ， 可 是 千篇一律 的 祝福 不 仅 无 法 体 
现 出 心意 ， 反 而 会 让 接收 者 厌烦 ， 但 一 个 一 个 发 送 又 太 过 烦琐 ， 本 程序 实现 的 群发 消息 可 
根据 接收 者 昵称 或 备注 自动 填充 , 做 到 发 送 的 每 一 条 消息 都 不 一 样 , 接收 者 也 更 容易 接收 。 

定时 发 送 消息 的 需求 主要 为 自动 报时 ， 防 止 因 长 时 间 没有 消息 被 微 信 认为 挂机 而 强制 
下 线 等 ， 一 般 可 通过 此 方法 延长 机 器 人 的 运行 时 长 。 

在 群发 消息 时 ， 若 遇 到 好 友 状 态 异常 ， 例 如 拉 黑 或 删除 等 ， 微 信 会 发 送 系 统 消息 ， 提 
示 该 好 友 状态 异常 ， 此 时 可 通过 检测 微 信 返回 消息 ， 并 给 异常 好 友 不 同 的 备注 来 实现 好 友 
状态 检测 功能 。 

注意 : 在 群发 消息 时 需要 注意 发 送 频率 , 编者 经 过 几 次 测试 ,发现 有 10 个 好 友 , 在 1 一 
4 秒 时 间 段 随机 取 一 个 时 间 进 行 休眠 , 连续 12 小 时 发 送 文本 消息 未 出 现 因 发 送 频繁 被 限制 
发 送 的 情况 ， 因 此 本 程序 限制 随机 时 间 为 1 一 4 秒 。 文 件 消息 需 延 长 此 时 间 ， 可 以 通过 配置 
文件 修改 文本 消息 休眠 时 长 。 

@ 发 送 消息 线程 


def Process (self) : 





text="Never lie to someone who trust you. Never trust someone who lies 
和 OQ VOWE tO 
for contact in self.wechat.ContactList: 

#self .wechat.send text (contact['UserName'], text % contact['NickName']) 
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self.wechat.Log.info("send msg to:%s,text:%s" % (contact['NickName'], 
text $$ contact['NickName'])) 
t=random.uniform(1, 4) 
time.sleep (t) # 随 机 休眠 一 段 时 间 ， 避 免 微 信 认 为 操作 违法 
# 每 小 时 向 文件 助手 发 送 一 个 消息 ， 避 免 长 时 间 无 操作 被 微 信 认 为 挂机 ， 从 而 强制 下 线 
current minutes=int (get now time('%M')) 
if current minutes==59: 
self.wechat .send text('filehelper', ' 主人 主人 ,为 您 报时 ,当前 时 间 :%s' sg 
get now time()) 
time.sleep (60) 


注意 : 在 好 友 多 的 情况 下 ， 群 发 消息 因为 需要 休眠 比较 耗 时 ， 一 般 采 用 多 线程 实现 群 
发 ,避免 影响 主线 程 同 步 消 息 断 开 。 在 实际 开发 中 ,发 送 消息 任务 一 般 通 过 Tedis 等 消息 队 
列 通 知 发 送 消息 内 容 ， 机 器 人 获取 到 之 后 进行 发 送 。 

@ 发 送 结果 
群发 消息 演示 如 图 8-6 所 示 。 








图 8-6 群发 消息 演示 


注意 : 为 避免 给 好 友 带 来 骚扰 ， 上 述 代码 中 调用 发 送 函 数 的 语句 已 注释 ， 通 过 Log 打 
印 要 发 送 的 消息 展示 发 送 结果 。 
@ 好 友 状 态 检 测 


SYS BLACK LIST CONTRACT= "消息 已 发 出 ， 但 被 对 方 拒 收 了 。 
SYS_DELETE_CONTACT="' 开 启 了 朋友 验证 ， 你 还 不 是 他 (她 ) 朋友 。 请 先 发 送 朋友 验证 请 求 ， 
对 方 验证 通过 后 才能 聊天 ' 
if msg['MsgType']==self.wechat.wx conf['MSGTYPE SYS']: 
if content==Constant.SYS BLACK LIST CONTACT:  # 黑 名 单 
res=self.wechat .webwxoplog (msg['FromUserName'], 
remark name= 'A- 拉 黑 -%s' % user['NickName']) 
self .wechat .Log.info(' [ 黑 名 单 ] 给 $s 设置 备注 :$s'% (user['NickName'],， res)) 
elif Constant.SsYS DELETE CONTACT in content: # 被 删除 好 友 
res=self .wechat .webwxoplog (msg['FromUserName'], 
remark name= 'A- 删 除 -%s' % user['NickName']) 
self .Log .info(' [删除 好 友 ] 给 $s 设置 备注 :ss' % (user['NickName']，res)) 
elif content.startswith (Constant .SYS ACCESS VERIFY INFO START): 


# 新 添加 好 友 
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data={ 
"msgType": 1, 
"data": '$s 你 好 ， 终 于 等 到 你 ~' s user['NickName'] 
3 
self.send msg(data, user['UserName']) 
self .Log.info(' [新 增 好 友 ] 给 $s 发 送 欢 迎 语 ' $ (user['NickName'])) 


8.4.3 ”自动 邀请 好 友 加 入 群 聊 


对 于 一 些 公司 或 个 人 的 特殊 需求 ， 需 要 根据 某 些 属性 自动 邀请 用 户 进入 不 同 的 群 聊 ， 
例如 华中 区 、 华 南 区 等 ， 此 时 需要 机 器 人 根据 用 户 发 送 的 特殊 指令 + 关键 词 〈 例 如 我 要 入 
群 + 华中 ) 自动 查询 所 属 的 群 聊 ， 然 后 给 该 用 户 发 送 入 群 链接 ， 并 引导 用 户 单 击 加 入 。 

程序 设计 包括 好 友 消 息 分 析 、 关 键 词 和 群 聊 对 应 关系 、 自 动 发 送 入 群 邀请 、 自 动 发 送 
提示 语句 等 ， 具 体 如 下 : 

和 @ 初始 化 关键 词 和 群 获 对 应 关系 

self.enter group keyword={ 自动 入 群 关键 词 和 和 群 聊 对 应 字典 

呈 群 ':' 测 试 1 群 '， 
'2 群 ':' 测 试 2 群 '， 

















} 
@ 根据 群 名 查找 群 聊 


def get group by name(self, name): 
for member in self.GroupList: 
if member['NickName']==name: 
return member 
return None 
} 


@ 更 新 群 多 API 函数 


def webwxupdatechatroom(self, room user name, add arr="", del arr="", 
invite arr="", topic=None): 
flag=0 
dic=None 
while flag < 2: 
try: 
params={ 
'BaseRequest': self.get base request ()， 
'ChatRoomName': room user name 
} 
base url=self.wx conf['API webwxupdatechatroom'] + '?fun=%s' 
if invite arr: # 发 送 入 群 邀请 链接 
url=base url % "invitemember'" 


params['InviteMemberList']=invite arr 
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elif adqd arr: # 直 接 添加 进 群 
url=base Url % "addmember 
Params ['RddMemberList']=add arr 
elif del arr: 坦 删 除 群 成 员 
url=base url $ 'delmember' 
params['DelMemberList']=add arr 
elif topic: 间 修 改 群 名 
url=base url $ 'modtopic' 
params['NewTopic']=topic 
headers={'content-type': 'application/json; charset=UTF-8'} 
Url += '&lang=zh CN&pass ticket=' + self.pass ticket 
dic=post (url, params, True, headers) 
#Ret 0 成 功 
# ”-1|-2 ”失败 ， 群 开启 群 主 验证 
# ”1205 ”失败 操作 频繁 
if dic['BaseResponse']['Ret']!= 0: 
group=self.get group by id(room user name) 
self .Log.error(' [ss] 更 新 群 聊 失败 , 错误 代码 :ss, 错误 原因 :%s' %% 
(group ['NickName']，dic['BaseResponse']['Ret']， 
dic['BaseResponse']['ErrMsg'])) 
self.Log.infol(str (dic)) 
return dic['BaseResponse']['Ret']== 
except: 
flag=flag+1 
Lc 
self.Log.info(dic) 
self.Log.error (traceback.format exc()) 
return False 


@ 好 友 消 息 分 析 

#Constant .STRING ENTER GROUP _ KEYWORD=' 我 要 入 群 +' 

if Constant.STRING ENTER GROUP KEYWORD in content: # 关 键 词 入 群 
keyword=content .split (Constant .STRING ENTER GROUP KEYWORD) [1] 
# 在 关键 词 列表 中 查找 所 属 群 


room name=self.wechat.enter group keyword[keyword] if keyword in self 
-Wechat .enter group keyword else None 
remind msg=Constant.STRING ENTER GROUP NOT FOUND  # 换 个 关键 词 试 试 
if room name: 
group=self.wechat .get group by name (room name) 
if group: 
res=self .wechat .webwxupdatechatroom(group['UserName'], invite arr 
=user['UserName']) 


if res: 


remind msg=Constant .STRING ENTER GROUP_ SUCCESS# 邀 请 链接 进 群 
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else: 
remind msg=Constant .STRING ENTER GROUP UNKNOWN ERROR# 出 错 

data={ 

"msgType”: 1, 

"data": remind msg 
1 
t=random.uniform(1, 4) 
time.sleep (t) 
self.send msg(data, user['UserName']) 
self.Log.info('to:%s,send:%s' $$ (user['NickName'], remind msg))} 


其 实现 效果 如 图 8-7 所 示 。 


GeekBot 





蝇 tio 


和 > 


景 日 DGismbiaiitititepmt 


本 六 全 
本 要 二 


量 。 夫人 关键 记 汪 训 吧 





D SC 


图 8-7 自动 发 送 入 群 邀 请 
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9.1 二 维 码 介绍 


二 维 码 〈 二 维 条 码 ) 是 指 在 一 维 条 码 的 基础 上 扩展 出 的 另 一 维 具 有 可 读 性 的 条 码 ， 使 
用 黑白 矩形 图 案 表 示 二 进 制 数据 ， 被 设备 扫描 后 可 获取 其 中 所 包含 的 信息 。 一 维 条 码 的 宽 
度 记载 着 数据 ， 而 其 长 度 没 有 记载 数据 。 二 维 条 码 的 长 度 、 宽 度 均 记载 着 数据 。 二 维 条 码 
有 一 维 条 码 没 有 的 “定位 点 ”和 “容错 机 制 ”。 容 错 机 制 使 得 在 即使 没有 辨识 到 全 部 的 条 码 
或 者 条 码 有 污 损 时 也 可 以 正确 地 还 原 条 码 上 的 信息 。 二 维 码 的 种 类 很 多 ， 不 同 的 机 构 开 发 
出 的 二 维 码 具 有 不 同 的 结构 以 及 编写 、 读 取 方 法 。 

@ 堆 乔 式 一 维 码 

堆 又 式 二 维 码 例如 PDF417〔 证 件 及 卡片 等 大 容量 、 高 可 靠 性 信息 自动 存储 、 携 带 并 
可 用 机 器 自动 识别 )、Code49、Codel16K、Ultracode 等 。 

@ 算 阵 式 一 维 码 

矩阵 式 二 维 码 例如 QR 码 、Code One、Aztec、Data Matrix 等 。 

本 章 使 用 的 二 维 码 是 QR Code (Quick Response Code)， 学 名 为 快速 响应 矩阵 码 ， 它 是 
二 维 条 码 的 一 种 。QR 二 维 码 目 前 在 很 多 地 方 有 着 广泛 的 应 用 ， 例 如 通过 微 信 二 维 码 加 好 
友 、 将 应 用 软件 的 下 载 地 址 做 成 二 维 码 , 等 等 .QR 二 维 码 是 于 1994 年 由 日 本 的 Denso-Wave 
公司 发 明 的 。QR 是 英文 Quick Response 的 缩写 ， 即 快速 响应 的 意思 ， 源 自发 明 者 希望 QR 
码 可 让 其 内 容 快速 被 解码 。QR 二 维 码 比 普通 条 码 可 储存 更 多 资料 ， 也 无 须 像 普通 条 码 那 
样 在 扫描 时 需要 直线 对 准 扫描 器 。 

QR 码 呈 正方 形 ， 只 有 黑 、 白 两 色 ， 在 3 个 角落 印 有 较 小 、 像 “ 回 ” 字 的 正方 形 图 案 。 
这 3 个 图 案 是 帮助 解码 软件 定位 的 图 案 ， 用 户 不 需要 对 准 ， 无 论 以 何 角度 扫描 ， 数 据 仍 可 
被 正确 读 取 。 

QR 二 维 码 的 结构 如 下 。 

















第 9 章 图 像 处 理 一 一 生成 二 维 码 和 验证 码 

(1) 版 本 信息 : version1 (21x21)，version2，…，version40， 一 共 40 个 版 本 。 版 本 代 
表 每 行 有 多 少 码 元 模块 ， 每 一 个 版 本 比 前 一 个 版 本 增加 4 个 码 元 模块 ， 计 算 公 式 为 (n-1)x 
4+21， 每 个 码 元 模块 存储 一 个 二 进 制 0 或 者 1， 黑 色 模 块 表 示 二 进 制 “1”， 白 色 模 块 表示 
二 进 制 “0”， 例 如 versionl 表示 每 一 行 有 21 个 码 元 模块 。 
(2) 格式 信息 : 存储 容错 级 别 有 工 (7%)、M (15%)、Q (25%)、R (35%)。 容 错 指 
允许 存储 的 二 维 码 信 息 出 现 重复 部 分 ， 级 别 越 高 ， 重 复 信息 所 占 的 比例 越 高 。 其 目的 是 即 
使 二 维 码 被 图 标 遮 住 一 部 分 ， 一 样 可 以 获取 全 部 二 维 码 内 容 。 有 图 片 的 二 维 码 ， 图 片 不 算 
二 维 码 的 一 部 分 ， 它 遮 住 一 部 分 码 元 ， 但 还 是 可 以 扫描 到 所 有 内 容 。 

(3) 数据 和 纠 错 码 字 : 实际 保存 的 二 维 码 信息 和 纠 错 码 字 《〈 用 于 修正 二 维 码 损坏 带 来 
的 错误 ， 也 就 是 说 当 码 元 被 图 片 遮 住 时 可 以 通过 纠 错 码 字 来 找 回 )。 

(4) 位 置 探 测 图 形 : 用 于 对 二 维 码 的 定位 。 位 置 探测 图 形 用 于 标记 矩形 大 小 ，3 个 图 
形 确定 一 个 矩形 。 

上 述 二 维 码 结构 信息 按照 一 定 的 编码 规则 变 成 二 进 制 ， 通 过 黑 、 白 色 形 成 矩形 。 

除了 标准 的 QR 码 之 外 ， 还 存在 一 种 称 为 “微型 QR 码 ” 的 格式 ， 它 是 QR 码 标准 的 
缩小 版 本 ， 主 要 是 为 了 无 法 处 理 较 大 型 扫描 的 应 用 而 设计 。 微 型 QR 码 同样 有 多 种 标准 ， 
最 多 可 存储 35 个 字符 。 


9.2 二 维 码 生 成 和 解析 关键 技术 
9.2.1 qrcode 库 的 使 用 


@ 安装 qrcode 库 

如 果 要 用 Python 生成 二 维 码 ， 首 先 需要 下 载 Python 的 二 维 码 库 qdrcode。qrcode 库 是 
用 于 生成 二 维 码 图 像 的 Python 第 三 方 库 。 

qrcode 二 维 码 生成 包 的 安装 如 下 在 命令 行 cmd 中 ): 










































C:\> pip install qrcode 
查看 qrcode 库 的 安装 信息 ， 如 图 9-1 所 示 。 


C:\> pip show qrcode 





郴 管理 员 : C\Windows\system32\cmd.exe 


istrator>pip shov qrcode 


oop/python-qrcode 


‘site-packages 








图 9-1 查看 qrcode 库 的 安装 信息 
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@ 生成 二 维 码 

导入 qrcode 模块 后 ，make0 函 数 返 回 一 个 qrcode.image.pil.Pillmage 对 象 ， 调 用 make() 
函数 生成 一 个 二 维 码 图 片 对 象 ， 如 图 9-2 所 示 ， 最 后 调用 图 片 对 象 的 saveO 函 数 就 可 以 将 
生成 的 二 维 码 保存 下 来 。 代 码 如 下 : 


import qrcode 


























img=qrcode.make ("http://www.zut.edu.cn") 
img.save ("xinxing.png") 


图 9-2 生成 的 二 维 码 图 片 xinxing.png 


上 面 是 按照 qrcode 默认 的 方式 生成 二 维 码 ， 如 果 希 望 生成 不 同 尺寸 的 二 维 码 ， 则 需要 
使 用 QRCode 类 ， 如 下 : 

QRCode (version=None, error correction=constants.ERROR CORRECT M, box size=10, 

border=4, image factory=None) 

version 表示 二 维 码 的 版 本 号 ， 二 维 码 总 共有 1 一 40 个 版 本 ， 最 小 的 版 本 号 是 1， 对 应 
的 尺寸 是 21X21, 每 增加 一 个 版 本 会 增加 4 个 尺寸 这 里 所 说 的 尺寸 不 是 生成 图 片 的 大 小 ， 
而 是 指 二 维 码 的 长 宽 被 平均 分 为 多 少 份 

error_correction 指 的 是 纠 错 容量 ， 这 就 是 为 什么 二 维 码 上 面 放 一 个 小 图 标 也 能 扫 出 来 
的 原因 ， 纠 错 容量 有 4 个 级 别 ， 分 别 如 下 。 

。 ERROR_ CORRECT LL 级 别 : 7% 或 更 少 的 错误 能 修正 。 

。 ERROR_ CORRECT_M M 级 别 : 15% 或 更 少 的 错误 能 修正 , 也 是 qrcode 的 默认 级 别 。 

。 ERROR_CORRECT_Q Q 级 别 : 25% 或 更 少 的 错误 能 修正 。 

。 ERROR CORRECT_H H 级 别 : 30% 或 更 少 的 错误 能 修正 。 

box size 指 的 是 生成 图 片 的 像素 。 

border 表示 二 维 码 的 边框 宽度 ，4 是 最 小 值 。 

image_factory 参数 是 一 个 继承 于 qrcode.image.base.BaseImage 的 类 ， 用 于 控制 make_ 
image() 函 数 返 回 的 图 像 实例 。image_factory 参数 可 以 选择 的 类 保存 在 模块 根 目录 的 image 
文件 夹 下 。image 文件 夹 里 面 有 5 个 .py 文件 ， 其 中 一 个 为 ”init _.py, 一 个 为 base.py， 还 
有 pilpy 提供 了 默认 的 qrcode.image.pil.PilImage 类 )、pure.py (提供 了 grcode.image 
.pure.PymagingImage 类 )、svg.py (提供 了 SvgFragmentImage、SvgImage 和 SvgPathImage 
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几 个 类 )。 

注 : 实际 上 ，make0 函 数 也 是 通过 实例 化 一 个 QRCode 对 象 来 生成 二 维 码 的 。 在 调用 
makeO 的 时 候 也 可 以 传 入 初始 化 参数 。 

例子 如 下 : 


import qrcode 
qr=qrcode .QRCode ( 
version=1, 
error correction=qrcode.constants.ERROR CORRECT L, 
box size=10, 
border=4, 
) 
qr.add datal('http://www.zut.edu.cn') 
qr.make (fit=True) 
img=qr .make image() 


img.save('xinxingzhao.png') 


说 明 :; QRCode 对 象 的 make_image() 函 数 可 以 通过 改变 人 1_color 和 back_color 参数 来 
改变 所 生成 图 片 的 背景 颜色 和 格子 颜色 。 

@ 生成 其 他 类 型 的 二 维 码 

用 户 可 以 将 二 维 码 图 片 转化 为 SVG (矢量 图 )。 qrcode 可 以 生成 3 种 不 同 的 SVG 图 像 ， 
一 种 是 用 路 径 表示 的 SVG， 一 种 是 用 和 矩形 集合 表示 的 完整 SVG 文件 ， 还 有 一 种 是 用 和 托 形 
集合 表示 的 SVG 片段 。 第 1 种 用 路 径 表示 的 SVG 其 实 就 是 矢量 图 ， 可 以 在 图 像 放大 的 时 
候 保持 图 片 质量 ， 而 另外 两 种 可 能 会 在 格子 之 间 出 现 空隙 。 

这 3 种 分 别 对 应 了 svg.py 中 的 SvgPathImage、SvgImage 和 SvgFragmentImage 类 。 在 
调用 qrcode make(O) 函 数 或 者 实例 化 QRCode 时 当 作 参数 传 入 就 可 以 了 。 

另外 还 有 qrcode.image.svg.SvgFillImage 和 qrcode.img.svg.SvgPathFillImage, 分 别 继 承 
自 SvgImage 和 SvgPathImage。 这 两 个 并 没有 其 他 改变 ， 只 不 过 是 默认 把 背景 颜色 设置 为 
白色 而 已 。 


import qrcode 
import qrcode.image.svg 
if method=='basic' : 
# 简 单 的 工厂 ， 只 有 一 套 
factory=qrcode.image.svg.SvgImage 
elif method=='fragment' : 
# 碎 片 工 厂 (也 只 是 一 组 矩形 ) 
factory=qrcode.image.svg.SvgFragmentImage 
else: 
# 组 合 路 径 工厂 ， 修 复 缩放 时 可 能 出 现 的 空白 
factory=qrcode.image.svg.SvgPathIimage 


img=qrcode .make ('xinxingzhao', image factory=factory) 
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9.2.2 ”PIL 库 的 使 用 


生成 二 维 码 图 像 同时 依赖 于 PIL 库 ，PIL (Python Imaging Library， 图 像 处 理 类 库 ) 提 
供 了 通用 的 图 像 处 理 功 能 ， 以 及 大 量 有 用 的 基本 图 像 操作 ， 例 如 图 像 的 缩放 、 裁 前 、 旋 转 
和 颜色 转换 等 。PIL 是 Python 语言 的 第 三 方 库 ， 安 装 PIL 库 的 方法 如 下 ， 需 要 安装 的 库 的 
名 字 是 pillow。 

C:\> pip install pillow 或 者 pip3 install pillow 


PIL 库 支持 图 像 的 存储 、 显 示 和 处 理 ， 能 够 处 理 几乎 所 有 图 片 格式 ， 可 以 完成 对 图 像 
的 缩放 、 剪 裁 、 码 加 以 及 向 图 像 添加 线条 和 文字 等 操作 。 

PIL 库 主要 实现 图 像 归 档 和 图 像 处 理 两 方面 的 功能 需求 。 

。 图 像 归档 : 对 图 像 进行 批 处 理 、 生 成 图 像 预览 、 转 换 图 像 格式 等 。 

。 图 像 处 理 : 图 像 的 基本 处 理 、 像 素 处 理 、 颜 色 处 理 等 。 

根据 不 同 功 能 ，PIL 库 共 包括 21 个 与 图 像 相 关 的 类 ， 这 些 类 可 以 被 看 作 是 子 库 或 PIL 
库 中 的 模块 ， 各 模块 如 下 : 

Image 、 ImageChops 、JmageCrackCode 、ImageDraw、ImageEnhance 、 ImageFile 、 

















ImageFileIO、 ImageFilter、 ImageFont、 ImageGrab、 ImageOps、 ImagePath、 ImageSequence、 
ImageStat、ImageTk、ImageWin、PSDraw 

下 面 介绍 几 种 最 常用 的 模块 。 

@ Image 模块 

Image 模块 是 PIL 中 最 重要 的 模块 ， 它 提供 了 诸多 图 像 操作 功能 ， 例 如 创建 、 打 开 、 
显示 、 保 存 图 像 等 功能 ， 合 成 、 裁 前 、 滤 波 等 功能 ， 获 取 图 像 属 性 等 功能 。 

PIL 中 的 Image 模块 提供 了 Image 类 ， 用 户 可 以 使 用 Image 类 从 大 多 数 图 像 格式 的 文件 中 
读 取 数据 ， 然 后 写 到 最 常见 的 图 像 格 式 文件 中 。 如 果 要 读 取 一 幅 图 像 ， 可 以 使 用 以 下 代码 ; 

from PIL import Image 

pil im=Image.open('empire.jpg') 

上 述 代码 的 返回 值 pil_im 是 一 个 PIL 图 像 对 象 。 

用 户 也 可 以 直接 使 用 Image.new(mode,size,color=None) 创 建 图 像 对 象 ，color 的 默认 值 
是 黑色 。 


newIm=Image.new('RGB'， (640, 480), (255, 0, 0)) # 新 建 一 个 Image 对 象 
这 里 新 建 了 一 个 红色 背景 、 大 小 为 〈640, 480) 的 RGB 空白 图 像 。 


图 像 的 颜色 转换 可 以 使 用 Image 类 的 convert() 方 法 来 实现 。 如 果 要 读 取 一 幅 图 像 ， 并 
将 其 转换 成 灰 度 图 像 ， 只 需要 加 上 convert(L) 即 可 ， 例 如 : 


pil im=Image.open('empire.jpg') .convert ('L') ## 转 换 成 灰 度 图 像 


四 ImageChops 模块 
ImageChops 模块 包含 一 些 算术 图 形 操 作 ， 即 channel operations("chops")。 这 些 操作 可 
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用 于 诸多 目的 ， 例 如 图 像 特效 、 图 像 组 合 、 算 法 绘图 等 。 通 道 操 作 只 用 于 位 图 (比如 工 模 
式 和 RGB 模式 )。 大 多 数 通道 操作 有 一 个 或 者 两 个 图 像 参 数 ， 返 回 一 个 新 的 图 像 。 

每 张 图 片 都 是 由 一 个 或 者 多 个 数据 通道 构成 的 。 以 RGB 图 像 为 例 , 每 张 图 片 都 是 由 3 
个 数据 通道 构成 的 ， 分 别 为 R、G 和 B 通道 。 对 于 灰 度 图 像 ， 只 有 一 个 通道 。 
ImageChops 模块 的 使 用 如 下 : 


from PIL import Image 









































im=Image.open('D:\\1.jpg') 
from PIL import ImageChops 


im dup=ImageChops .duplicate (im) # 复 制图 像 ， 返 回 给 定 图 像 的 副本 
print (im dup.mode) # 输 出 模式 : 'RGB' 


im diff=ImageChops.difference (im, im dup) # 返 回 两 幅 图 像 之 间 像 素 差 的 绝对 值 形 成 的 图 像 
im diff.show() 


1 于 图 像 im_ dup 是 由 im 复制 过 来 的 ， 所 以 它们 的 差 为 0， 图 像 im_diff 在 显示 时 为 




















黑 图 。 
加 ImageDraw 模块 
ImageDraw 模块 为 Inage 对 象 提供 了 基本 的 图 形 处 理 功 能 ， 例 如 它 可 以 为 图 像 添加 几 
何 图 形 。 

ImageDraw 模块 的 使 用 如 下 : 


from PIL import Image, ImageDraw 
im=Image.open('D:\\1.jpg') 

draw=ImageDraw.Draw (im) 

draw.line((0,0)+im.size, fill=128) 

draw.line((0, im.size[1], im.size[0], 0), fill=128) 
im.show() 


其 结果 是 在 原 有 图 像 上 画 了 两 条 对 角 线 。 

四 ImageEnhance 模块 

ImageEnhance 模块 包括 了 一 些 用 于 图 像 增强 的 类 ， 它 们 分 别 为 Color 类 、Brightness 
类 、Contrast 类 和 Sharpness 类 。 

ImageEnhance 模块 的 使 用 如 下 : 


from PIL import Image, ImageEnhance 
im=Image.open('D:\\1.jpg') 
enhancer=ImageEnhance.Brightness (im) 
im0=enhancer .enhance (0.5) 

im0.show() 


其 结果 是 图 像 im0 的 亮度 为 图 像 im 的 一 半 。 

全 ImageFile 模 块 

ImageFile 模块 为 图 像 的 打开 和 保存 提供 了 相关 支持 功能 。 

@ ImageFilter 模块 

JImageFilter 模块 包括 各 种 滤波 器 的 预定 义 集合 ， 与 Inage 类 的 filter() 方 法 一 起 使 用 。 
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该 模块 包含 一 些 图 像 增强 的 滤波 器 , 例如 BLUR、CONTOUR、DETAIL、EDGE ENHANCE、 
EDGE ENHANCE MORE、 EMBOSS、 FIND EDGES、SMOOTH、SMOOTH MORE 和 
SHARPEN。 

ImageFilter 模块 的 使 用 如 下 : 


from PIL import Image 

im=Image.open('D:\\1.jpg') 

from PIL import ImageFilter 

imout=im. filter (ImageFilter .BLUR) 

print (imout.size)# 图 像 的 尺寸 大 小 为 (300，450) ， 它 是 一 个 二 元 组 ， 即 水 平和 垂直 方向 上 的 像素 数 


imout .show() 


@@ ImageFont 模块 

ImageFont 模 块 定义 了 一 个 同名 的 类 , 即 ImageFont 类 ,在 这 个 类 的 实例 中 存储 着 bitmap 
字体 ， 需 要 和 ImageDraw 类 的 text0 方 法 一 起 使 用 。 

在 Python 中 通过 使 用 PIL 库 中 的 这 些 模 块 和 类 来 处 理 和 使 用 图 像 。 


9.3.1 生成 带 有 图 标的 二 维 码 


事先 准备 一 个 logo 图 标志 ， 使 用 下 面 的 程序 生成 带 有 logo 图 标的 二 维 码 。 


import qrcode 
from PIL import Image 
import os, sys 
def gen qrcode(string, path, lo0go=""): 
生成 中 间 带 1ogo 的 二 维 码 
需要 安装 qrcode、PIL 库 
8 参数 string: 二 维 码 字 符 串 
8 参数 path: 生成 的 二 维 码 保存 路 径 
@ 参 数 1ogo: logo 文件 路 径 


Q@return: None 


mm 
# 初 步 生成 二 维 码 图 像 
qr=qrcode .QRCode ( 
Version=2， 
error correction=qrcode .constants .ERROR CORRECT H, 
box size=8, 
border=1 
) 
qr.add data (string) 
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qr.make (fit=True) 
# 获 得 Image 实例 并 把 颜色 模式 转换 为 RGBR 
img=qr.make image() 
img=img .convert ("RGBA") 
if logo and os.path.exists (1ogo) : 
try: 
icon=Image .open (1ogo) 埋 打开 填充 的 logo 文件 
img w, img h=img.size 
except Exception as e: 
print (e) 
sys.exit (1) 
factor=4 
# 计 算 logo 的 尺寸 
size w=int (img w/factor) 
size h=int (img h/factor) 
# 比 较 并 重新 设置 logo 文件 的 尺寸 
icon w,icon h=icon.size 
if icon w>size w: 
icon w=size W 
if icon h>size h: 
icon h=size h 
icon=icon.resize((icon w,icon h), Image.ANTIALIAS) 
# 计 算 logo 的 位 置 ， 并 复制 到 二 维 码 图 像 中 
w=int((img w-icon w) /2) 
h=int((img h-icon h)/2) 
icon=icon.convert ("RGBA") 
img.paste(icon, (w, h),icon) 





# 保 存 二 维 码 
img.save (path) # 例 如 qrcode .png 
__name_ a 


info=" http://www.zut.edu.cn " 

pic path="qrcode.png" # 生 成 的 带 有 图 标的 三 维 码 图 片 ， 如 图 9-3 所 示 
1ogo_path="logo.pngn" # 用 于 填充 的 图 标 

gen qrcode (info, pic path,1o0go path) 





图 9-3 生成 的 带 有 图 标的 二 维 码 图 片 qrcode.png 
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9.3.2 Python 解析 二 维 码 图 片 


解析 二 维 码 图 片 的 信息 需要 使 用 zbarlight (二 维 码 解析 包 )，zbarlight 的 安装 如 下 : 


pip install zbarlight 


注意 ，zbarlight 二 维 码 解析 包 仅仅 支持 Python2.7 以 下 的 版 本 。 


import zbar 





def decode qrcode (Path) : 


解析 二 维 码 信 息 
@ 参 数 path: 二 维 码 图 片 路 径 
ereturn: 二 维 码 信息 


scanner=zbar.ImageScanner () # 创 建 图 片 扫描 对 象 
scanner.parse config('enable') # 设 置 对 象 属性 
img=Image .open (path) .convert ('L') 打开 含有 二 维 码 的 图 片 
width, height=img.size # 获 取 图 片 的 尺寸 


# 建 立 zbar 图 片 对 象 并 扫描 转换 为 字 节 信息 
qrCode=zbar.Image (width, height, ‘'Y800', img.tobytes()) 
Scanner .scan (gqrCode) 
# 组 装 解码 信息 
data="” 
for s in qrCode: 
data += s.data 


del img # 删 除 图 片 对 象 
return data # 输 出 解码 结果 
if _ name =="_ main _": 
info=" http://www.zut.edu.cn " 
pic path="qrcode .png" # 生 成 的 带 有 图 标的 二 维 码 图 片 
logo path="1logo.png" # 用 于 填充 的 图 标 


gen qrcode (info，Ppic path, 1ogo path) 
print (decode qrcode (pic path)) 
# 得 到 二 维 码 内 的 文本 信息 ， 即 网 址 “http://www.zut.edu.cn” 


9.4 用 Python 生成 验证 码 图 片 


基本 上 ， 大 家 使 用 每 一 种 网 络 服务 都 会 遇 到 验证 码 ， 一 般 是 网 站 为 了 
防止 恶意 注册 、 发 帖 而 设置 的 验证 手段 。 其 生成 原理 是 将 一 串 随机 产生 的 
数字 或 符号 生成 一 幅 图 片 ， 图 片 里 加 上 一 些 干扰 像素 (防止 OCR)。 下 面 
详细 讲解 如 何 生成 验证 码 。 

通常 ， 除 了 配置 好 的 Python 环境 以 外 ， 还 需要 配 有 Python 中 的 PIL 视频 讲解 
库 ， 这 是 Python 中 专门 用 来 处 理 图 片 的 库 。 
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如 果 要 生成 验证 码 图 片 ， 首 先 要 生成 一 个 随机 字符 串 ， 包 含 26 个 字母 和 10 个 数字 。 


# 用 来 随机 生成 一 个 字符 串 
def gene text() : 








#source=list (string.letters) 
CE 
2 
source=list (string.ascii letters) 
for index in range(0,10) : 

source.append (str (index) ) 
return ''.join(random.sample (source,number)) #number 是 生成 验证 码 的 位 数 


然后 要 创建 一 个 图 片 ， 写 入 字符 串 ， 需 要 注意 这 里 面 的 字体 是 不 同系 统 而 定 的 ， 如 果 
没有 找到 系统 字体 路 径 ， 也 可 以 不 设置 。 接 下 来 要 在 图 片上 画 几 条 干扰 线 。 
最 后 创建 扭曲 ， 加 上 滤 镜 ， 用 来 增强 验证 码 的 效果 。 下面 是 用 程序 生成 的 一 个 验证 码 。 


Be 




















完整 的 代码 如 下 : 


#coding=utf-8 

import random, string, sys, math 

from PIL import Image, ImageDraw, ImageFont, ImageFilter 
font path=' C:\Windows\Fonts\simfang.ttf " # 字 体 的 位 置 


number=4 # 生 成 几 位 数 的 验证 码 
size=(80, 30) # 生 成 验证 码 图 片 的 高 度 和 宽度 
bgcolor=(255, 255, 255) # 背 景 颜色 ， 默 认为 白色 
fontcolor=(0,0,255) # 字 体 颜 色 ， 默 认为 蓝 色 
linecolor=(255, 0,0) # 干 扰 线 颜色 ， 默 认为 红色 
draw line=True # 是 否 要 加 入 干扰 线 

line number=(1,5) # 加 入 干扰 线条 数 的 上 /下 限 


# 用 来 随机 生成 一 个 字符 串 
def gene text() : 
#source=list (string.letters) 
4SONrea = va "bool tar "or Ev eh 
OE Co Ce ne Pe TR 生涯 下 全 光学 才 省 
source=list (string.ascii letters) 
for index in range(0,10): 
source.append (str (index)) 
return ''.join(random.sample (source,number) ) #number 是 生成 验证 码 的 位 数 
# 用 来 绘制 干扰 线 
def gene line (draw,width,height): 





begin=(random.randint (0, width), random.randint (0, height)) 
end= (random.randint (0, width), random.randint (0, height)) 
draw.line([begin, end], fill=linecolor) 


# 生 成 验证 码 


def gene code(): 
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width,height=size ## 宽 和 高 
image=Image .new('RGBRA'， (width,height) ,bgcolor) 砷 创建 图 片 
font=ImageFont .truetype (font _ path, 25) # 验 证 码 的 字体 
draw=ImageDraw.Draw (image) # 创 建 画笔 
text=gene text () # 生 成 字符 趾 


font width, font height=font.getsize (text) 
draw.text (( (width - font width) /number, (height - font height) / number) ,text， 
font=font, fill=fontcolor) ## 填 充 字符 串 
if draw line: 
gene line (draw,width,height) 
image=image.transform( (width+20, height+10), Image.AFFINE, 


(1,-0.3,0,-0.1,1,0),Image.BILINEAR) # 创 建 扭曲 
image=image.filter (ImageFilter.EDGE ENHANCE MORE) 间 滤 镜 ， 边 界 加 强 
image.save('idencode.png') # 保 存 验证 码 图 片 
__name ==" main _": 


gene code() 


通过 上 面 的 两 个 例子 可 见 Python 的 图 像 处 理 功能 十 分 完善 。 


| 188 





10.1 连连 看 游戏 介绍 


“连连 看 ”是 源 自 中 国 台湾 的 桌面 小 游戏 ， 自 从 流入 中 国 大 陆 以 来 风靡 。 视频 讲解 
一 时 ， 也 吸引 了 众多 程序 员 开 发 出 多 种 版 本 的 “连连 看 ”。“ 连 连 看 ”考验 的 是 玩家 的 眼力 ， 
在 有 限 的 时 间 内 只 要 把 所 有 能 连接 的 相同 图 案 两 个 一 对 地 找 出 来 ， 每 找 出 一 对 ， 它 们 就 会 
自动 消失 ， 把 所 有 的 图 案 全 部 消 完 即 可 获得 胜利 。 所 谓 能 够 连接 ， 指 的 是 无 论 横向 或 者 纵 
向 ， 从 一 个 图 案 到 另 一 个 图 案 之 间 的 连 线 不 能 超过 两 个 弯 ， 其 中 ， 连 线 不 能 从 尚未 消去 的 
图 案 上 经 过 。 

连连 看 游戏 的 规则 如 下 : 

。 两 个 选中 的 方块 是 相同 的 。 

。 两 个 选中 的 方块 之 间 连 接线 的 折 点 不 超过 两 个 (连接 线 由 X 轴 和 Y 轴 的 平行 线 组 

成 )。 
本 章 开发 连连 看 游戏 ， 游 戏 效果 如 图 10-1 所 示 。 




















图 10-1 连连 看 游戏 的 运行 界面 
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本 游戏 增加 了 智能 查找 功能 ， 当 玩家 自己 无 法 找到 可 以 消去 的 两 个 方块 时 右 击 画 面 ， 
系统 则 会 提示 可 以 消去 的 两 个 方块 〈 被 加 上 红色 的 边框 线 )。 


10.2 程序 设计 的 思路 


@ 图 标 方块 的 布局 

游戏 中 有 10 种 方块 ， 如 图 10-2 所 示 ， 而 且 每 种 方块 有 10 个 ， 可 以 先 按 顺序 把 每 种 图 
标 方块 (数字 编号 ) 排 好 放 入 列表 tmpMap〔 临 时 的 地 图 ) 中 ， 然 后 用 random.shuffle0 打 
乱 列表 元 素 的 顺序 ， 依 次 从 tmpMap〔 临 时 的 地 图 ) 中 取 一 个 图 标 方块 放 入 地 图 map 中 。 
实际 上 ， 在 程序 内 部 是 不 需要 认识 图 标 方块 的 图 像 的 ， 只 需要 用 一 个 ID 来 表示 ， 在 运行 
界面 上 的 图 标 图 形 是 根据 地 图 中 的 ID 取 资 源 里 的 图 片 画 的 。 如 果 ID 的 值 为 空 ("” ")， 则 
说 明 此 处 已 经 被 消除 掉 了 。 


六 日 到 © 量 








bar_ 00.gif bar_01.gif bar_02.gif bar_03.gif bar_04.gif 
回 本 电 
bar_05.gif bar_06.gif bar 07.9gif bar 08.gif bar_ 09.gif 


图 10-2 图 标 方块 


imgs=[PhotoImage (file='H:\\ 连 连 看 \\gif\\bar 0'+str(i)+'.gif') for i in 

range (0,10)] # 所 有 图 标 图 案 

所 有 图 标 图 案 存储 在 列表 imgs 中 ,地 图 map 中 是 图 标 图 案 存储 在 列表 imgs 中 的 索引 
号 。 如 果 是 bar_02.gif 图 标 ， 在 地 图 map 中 实际 存储 的 是 2， 如 果 是 bar_08.gif 图 标 ， 在 地 
图 map 中 实际 存储 的 是 8。 

# 初 始 化 地 图 ， 将 地 图 中 的 所 有 方块 区 域 位 置 置 为 空 方 块 状态 

map=[[" " for y in range (Height)]for x in range (Width)] 

# 存 储 图 像 对 象 


image map=[[" " for y in range (Height)]for x in range (Width)] 

















cv=Canvas (root, bg='green', width=610, height=610) 
def create map() :# 产 生 map 地 图 

global map 

# 生 成 随机 地 图 

# 将 所 有 匹配 成 对 的 图 标 索 引号 放 进 一 个 临时 的 地 图 中 

tmpMap=[] 

m= (Width)*(Height)//10 

print ('m=",m) 


for x in range(0,m) : 
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Eor 1 In rangel0 LO: # 每 种 方块 有 10 个 
tmpMap .append (x) 
random. shuffle (tmpMap) # 生 成 随机 地 图 


for x in range(0,Width) : 
for y in range (0,Height) : 
map [zx] [Y]=tmpMap [x*Height+y] 起 从 上 面 的 临时 地 图 中 获取 
四 连通 算法 
那么 分 析 一 下 ， 可 以 看 到 连接 一 般 有 3 种 情况 ， 如 图 10-3 所 示 。 


医 芭 图 : 园 
@ @ 
| 

直 连 一 个 折 点 两 个 折 点 


图 10-3 ”两 个 选中 方块 之 间 连 接线 的 示意 图 


1) 直 连 方式 

在 直 连 方式 中 ， 要 求 两 个 选中 的 方块 x 和 y 相同 ， 即 在 一 条 直线 上 ， 并 且 之 间 没 有 
他 任何 图 案 的 方块 。 直 连 方式 在 3 种 连接 方式 中 最 简单 。 

2) 一 个 折 点 

其 实 ， 该 情况 相当 于 两 个 方块 画 出 一 个 矩形 ， 这 两 个 方块 是 一 对 对 角 顶 点 ， 另 外 两 个 
顶点 中 的 某 个 顶点 〈 即 折 点 ) 如果 可 以 同时 和 这 两 个 方块 直 连 ， 就 说 明 可 以 “一 折 连 通 ”。 

3) 两 个 折 点 

这 种 方式 的 两 个 折 点 〈zl、zZ2) 必定 在 两 个 目标 点 《两 个 选中 的 方块 ) pl、p2 所 在 的 
x 方向 或 y 方 向 的 直线 上 。 

按 pl1(x1,y]) 点 向 4 个 方向 探测 ,例如 向 右 探测 ,每 次 x1+1, 判 断 z1(x1+1,y1) 和 p2Cx2,y2) 
点 可 否 形 成 一 个 折 点 连通 性 ， 如 果 可 以 形成 连通 ， 则 两 个 折 点 连通 ， 否 则 直到 超过 图 形 右 
边界 区 域 。 假 如 超过 图 形 右 边界 区 域 ， 则 还 需要 判断 两 个 折 点 在 选中 方块 的 右 侧 ， 且 两 个 
折 点 在 图 案 区 域 之 外 连通 情况 是 否 存 在 。 此 时 判断 可 以 简化 为 判断 p2(x2,y2) 是 否 可 以 水 平 
直通 到 边界 。 

经 过 上 面 的 分 析 ， 两 个 方块 是 否 可 以 抵消 的 流程 图 如 图 10-4 所 示 。 





全 
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图 10-4 流程 图 


根据 图 10-4 所 示 的 流程 图 ， 对 选中 的 两 个 方块 (分 别 在 (x1,y1)、(x2,y2) 位 置 ) 是 否 可 
以 抵消 的 判断 如 下 实现 。 把 该 功能 封装 在 ELink( 方 法 里 面 ， 其 代码 如 下 : 





判断 选中 的 两 个 方块 是 否 可 以 消除 
def IsLink(pl,p2): 

if lineCheck (pl, p2): 
return True 


if secondLine (pl, p2): # 一 个 转弯 〈 折 点 ) 的 连通 方式 
return True 
if triLine (pl, p2): # 两 个 转弯 〈 折 点 ) 的 连通 方式 


return True 
return False 
直 连 方式 分 为 x 或 y 相同 的 情况 ， 同 行 同 列 情况 消除 的 原理 是 如 果 两 个 相同 的 被 消除 
方块 之 间 的 空格 数 spaceCount 等 于 它们 的 ( 行 / 列 差 -1)， 则 两 者 可 以 连通 。 
class Point: 
# 点 类 
def _ init _(self,x,y): 
self.x=x 
Selfey=y 
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* x 代表 列 ，y 代表 行 
* param pl 第 1 个 保存 上 次 选中 点 坐标 的 点 对 象 
* param p2 第 2 个 保存 上 次 选中 点 坐标 的 点 对 象 
# 直 接连 通 
def lineCheck (pl, p2): 
absDistance=0 
spaceCount=0 
if (pl.x==p2.x or pl.y==p2.y) :同行 同 列 吗 
print ("同行 同 列 的 情况 ------ 人 
# 同 列 的 情况 
if (pl.x==p2.x and pl.y != p2.y) 
print (" 同 列 的 情况 ") 
# 绝 对 距离 〈 中 间隔 着 的 空格 数 ) 
absDistance=abs (pl.y-p2.y)-1 
# 正 / 负 值 
po 0 OF 
区 == 于 
else 
区 EE 
for i in range (1,absDistance+1) : 
if (map[pl.x] [pl.y + i * zf]==" "): 
# 空 格 数 加 1 
spaceCount+=1 
else 
break;# 遇 到 阻碍 就 不 用 再 探测 了 
6 这 f (PICYEEP22Y andPL zl=p2.x): # 同 行 的 情况 
print ("同行 的 情况 ") 
absDistance=abs (pl .x-p2.x)-1 
# 正 / 负 值 
二 由 和 > 
ZE 
elsers 
2 
for i in range (1,absDistance+1) : 
if (map[pl.x + i * zf] [pl.y]==" "): 
# 空 格 数 加 1 
spaceCount+=1 
SL 
break; # 遇 到 阻碍 就 不 用 再 探测 了 
if (spaceCount==absDistance) 
# 可 连通 


print (absDistance, spaceCount) 
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print (" 行 / 列 可 直接 连通 ") 
return True 
else: 
print (" 行 / 列 不 能 消除 ! ") 
return False 
else: 
# 不 是 同行 同 列 的 情况 ， 所 以 直接 返回 False 


return False; 
一 个 折 点 连通 使 用 OneCornerLinkO 实 现 判断 。 其 实 相当 于 两 个 方块 画 出 一 个 矩形 ， 这 
两 个 方块 是 一 对 对 角 顶 点 ， 见 图 10-5 中 两 个 黑色 目标 方块 的 连通 情况 ,右上 角 打 又 的 位 置 
就 是 折 点 ， 左 下 角 打 叉 的 位 置 不 能 与 左上 角 的 黑色 目标 方块 连通 ， 所 以 不 能 作为 折 点 。 








图 10-5 一 个 折 点 连通 示意 图 


如 果 找 到 ， 则 把 折 点 放 入 linePointStack 列表 中 。 
# 第 2 种 ， 一 个 折 点 连通 (直角 连通 ) 


一 个 折 点 连通 
eparam first: 选 中 的 第 1 个 点 
eparam second: 选 中 的 第 2 个 点 


def secondLine(pl, p2): 


# 第 1 个 直角 检查 点 
checkP=Point (pl .x, p2.y) 
# 第 2 个 直角 检查 点 
checkP2=Point (p2.x, pl.y); 
# 第 1 个 直角 点 检测 


if (map[checkP.x] [checkP.y]==" "): 
if (lineCheck(pl, checkP) and lineCheck (checkP, p2)): 
linePointstack.append (checkP) 
print ("直角 消除 OK", checkP.x,checkP.y) 
return True 
# 第 2 个 直角 点 检测 
if (map[checkP2.x] [checkP2.y]==" "): 
if (lineCheck(pl, checkP2) and lineCheck (checkP2, p2)): 
linePointstack.append (checkP2) 
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print ("直角 消除 OK", checkP2 .x,checkP2.y) 
return True 
print ("不 能 直角 消除 "”) 
return False 
两 个 折 点 连通 ( 双 直 角 连 通 ) 使 用 TwoCornerLinkO 实 现 判断 。 双 直角 连通 的 判定 可 以 
分 两 步 进 行 : 
(1) 在 pl 点 周围 的 4 个 方向 寻找 空 块 checkP 点 。 
(2) 调用 OneComerLink(checkP, p2) 检测 checkP 与 p2 点 可 否 形成 一 个 折 点 连通 性 。 
两 个 折 点 连通 即 遍 历 pl 点 周围 4 个 方向 的 空格 ， 使 之 成 为 checkP 点 ， 然 后 调用 
OneCornerLink(checkP, p2) 判 定 是 否 为 真 ， 如 果 为 真 ， 可 以 双 直 角 连 通 ， 若 所 有 的 空格 都 遍 
历 完 还 没有 找到 ， 则 失败 。 
如 果 找 到 ， 则 把 两 个 折 点 放 入 linePointStack 列表 中 。 
# 第 3 种 ， 两 个 折 点 连通 〈 双 直角 连通 
eparam pl 第 1 个 点 
@param p2 第 2 个 点 





def TwoCornerLink (pl, p2): 
checkP=Point (pl .x, pl.y) 
#4 个 方向 的 探测 开始 
for i in range(0,4): 
CheckP.x=pl.x 
checkP.y=pl.y 
# 向 下 
if (i==3): 
checkP .y+=1 
while( (checkP.y<Height) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("下 探测 OK") 
return True 
laa 
linePointstack.pop() 
checkP .y+=1 
# 向 右 
elif (i==2): 
checkP-x+=1 
while( (checkP.x<Width) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print (" 右 探测 OK") 
return True 


slse: 
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TinePointStack.-pop () 
CheckP .X+=1 
# 向 左 
elif (i==1): 
checkP .x==1 
while( (checkP.x>=0) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print (" 左 探测 OK") 
return True 
S13es 
linePointstack.pop() 
CheckP .x-=1 
# 向 上 
elif (i==0): 
checkP.y-=1 
while( (checkP.y >=0) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("上 探测 OK") 
return True 
elaes 
linePointstack.pop() 
checkP.y-=1 
#4 个 方向 寻 完 也 没 找到 适合 的 checkP 点 
print ("两 直角 连接 没 找到 适合 的 checkP 点 ") 


return False; 


注意 : 上 面 的 代码 在 测试 两 个 折 点 连通 时 并 没有 考虑 两 个 折 点 都 在 游戏 区 域外 部 的 情 
况 ， 有 些 连连 看 游戏 不 允许 折 点 在 游戏 区 域外 侧 ( 即 边 界外 )。 如 果 允 许 这 种 情况 ， 对 上 面 
的 代码 做 如 下 修改 。 
# 向 下 
if (i==3): 
checkP.y+=1 
while( (checkP.y<Height) and map[checkP.x] [checkP.y]==" "): 
linePointstack.append (checkP) 
if (OneCornerLink (checkP, p2)): 
print ("下 探测 OK") 
return True 
SSeS 
linePointstack.pop() 
checkP.y+=1 
井 补充 两 个 折 点 都 在 游戏 区 域 底 侧 外 部 
if checkP.y==Height: # 出 了 底部 ， 仅 需 判 断 p2 能 否 达 到 底部 边界 
ZzZ=Point (p2.x,Height-—1) # 底 部 边界 点 
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if lineCheck (z,p2) : # 两 个 折 点 在 区 域外 部 的 底 侧 
linePointstack.append (Point (pl .x, Height)) 
linePointstack.append (Point (p2.x, Height)) 
print ("下 探测 到 游戏 区 域外 部 OK") 


return True 
对 于 其 余 3 个 方向 的 边界 外 部 两 个 折 点 的 连通 情况 判断 ， 请 读者 自己 思考 添加 。 


@ 智能 查找 功能 的 实现 


若 要 在 地 图 上 自动 查找 出 一 组 相同 、 可 以 抵消 的 方块 ， 通 常 采 用 遍历 算法 。 下 面 借助 
10-6 分 析 此 算法 。 


























图 10-6 ”匹配 示意 图 1 


在 图 中 找 相同 的 方块 时 ， 将 按 方块 地 图 map 的 下 标 位 置 对 每 个 方块 进行 查找 , 一 旦 找 
到 一 组 相同 、 可 以 抵消 的 方块 则 马上 返回 。 在 查找 相同 方块 组 的 时 候 ， 必 须 先 确定 第 1 个 
选 定 方块 (例如 0 号 方块 )， 然 后 在 这 个 基础 上 做 遍历 查找 第 2 个 选 定 方块 , 即 从 1 开始 按 
照 1、2、3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 ， 并 判断 选 定 的 两 个 方块 是 否 连 通 
抵消 ， 假 如 0 号 方块 与 5 号 方块 连通 ， 则 经 过 (0,1)、(0,2)、(0,3)、(0,4)、(0,5) 共 5 组 数据 
的 判断 对 比 ， 若 成 功 立即 返回 。 

如 果 找 不 到 匹配 的 第 2 个 选 定 方块 ， 则 如 图 10-7 (a) 所 示 编 号 加 1 重新 选 定 第 1 个 
方块 ( 即 1 号 方块 ) 进入 下 一 轮 ， 然 后 在 这 个 基础 上 做 遍历 查找 第 2 个 选 定 方块 ， 即 如 图 
10-7 (b) 所 示 从 2 号 开始 按照 2、3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 ， 直 到 搜 
索 到 最 后 一 块 〈 即 15 号 方块 )。 那 么 为 什么 从 2 开始 查找 第 2 个 选 定 方块 ， 而 不 是 从 0 号 
开始 呢 ? 因为 在 将 1 号 方块 选 定 为 第 1 个 选 定 方块 前 ，0 号 已 经 作为 第 1 个 选 定 方块 对 后 
面 的 方块 进行 可 连通 的 判断 了 ， 它 必然 不 会 与 后 面 的 方块 连通 。 























(a) 0 号 方块 找 不 到 匹配 方块 ， 选 定 1 号 (b) 从 2 号 方块 开始 找 匹 配 
图 10-7 匹配 示意 图 2 


如 果 找 不 到 与 1 号 方块 连通 且 相 同 的 方块 ， 则 编号 加 1 重新 选 定 第 1 个 方块 ( 即 2 号 
方块 ) 进入 下 一 轮 ， 从 3 号 开始 按照 3、4、5、6、7 等 的 顺序 查找 第 2 个 选 定 方块 。 
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按照 上 面 设计 的 算法 ， 整 个 流程 图 如 图 10-8 所 示 。 












( 开始 


bFound =False 





第 一 个 方块 的 编 
i 初始 化 为 0 





第 2 个 方块 的 编 
j 初 始 化 为 it1 





第 2 个 方块 编号 加 1 






出 断 是 否 最 后 一 个 
j=m_nRow*m nCol 





二 了 





第 ! 个 方块 编号 加 | bFound =True 























天 断 是 否 最 后 一 个 


i=m_nRow*m_nCol 








找到 后 用 画笔 画 
出 选中 框 线 


返回 bFound 


图 10-8 智能 查找 匹配 方块 的 流程 图 
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根据 流程 图 ， 把 自动 查找 出 一 组 相同 、 可 以 抵消 的 方块 的 功能 封装 在 Find2Block() 方 
里 面 ， 其 代码 如 下 : 


def find2Block (event): # 自 动 查找 
global firstSelectRectId,SecondSelectRectId 
m nRoW=Height 
m nCol=Width 
bFound=False; 
# 第 1 个 方块 从 地 图 的 0 位 置 开 始 
for i in range(0, m nRoW* m nCol): 
# 找 到 则 跳出 循环 
if (bFound): 
break 
# 算 出 对 应 的 虚拟 行 / 列 位 置 
xl1=i%m nCol 
yl=i//m ncol 
pl=Point (x1, y1) 
# 无 图 案 的 方块 跳 过 
lt (maplzullly Ll 





continue 
# 第 2 个 方块 从 前 一 个 方块 的 后 面 开始 
for j in range(i+l, m nRoW* m nCol): 
# 算 出 对 应 的 虚拟 行 / 列 位置 
x2=j%m nCol 
y2=j//m nCol 
p2=Point (x2, y2) 
# 第 2 个 方块 不 为 空 ， 且 与 第 1 个 方块 的 图 标 相同 
if (map [x2] [y2] !=' ' and IsSame (pl,p2)): 
# 判 断 是 否 可 以 连通 
if (IsLink(pl, p2)): 
bFound=True; 
break 
# 找 到 后 
if (bFound) : #p1 (x1, y1) 与 p2 (x2, y2) 连通 
print (' 找 到 后 ' ,pl .x,pl.y,p2.x,p2.y) 
# 画 选 定 (x1, y1) 处 的 框 线 
firstselectRectId=cv.create rectangle (x1*40, yl1*40, xl*40+40, 
yl*40+40, width=2, outline="red") 
# 画 选 定 (x2, y2) 处 的 框 线 
secondSselectRectId=cv.create rectangle (x2*40,y2*40,x2*40+40, 
y2*40+40,outline="red") 
#t=Timer (timer interval,delayrun) # 定 时 函数 自动 消除 
#t.start () 
return bFound 
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10.3 ”关键 技术 





10.3.1 ”图形 绘制 一 一 Tinker 的 Canvas 组 件 谷 


















































视频 讲解 
Tinker 的 Canvas (画布 ) 是 一 个 长 方形 区 域 ， 用 于 图 形 绘制 或 复杂 的 
形 界面 布局 。 用 户 可 以 在 画布 上 绘制 图 形 、 创 建文 字 、 ea 
@ 创建 Canvas 对 象 
用 户 可 以 使 用 下 面 的 方法 创建 一 个 Canvas 对 象 。 
Canvas 对 象 =Canvas (窗口 对 象 ， 选 项 ，... ) 
常用 选项 如 表 10-1 所 示 。 
表 10-1 Canvas 的 常用 选项 
属 性 说 明 
bd 指定 画布 的 边框 宽度 ， 单 位 是 像素 
bg 指定 画布 的 背景 颜色 
confine 指定 画布 在 滚动 区 域外 是 否 可 以 滚动 ， 默 认为 Tmue， 表 示 不 能 滚动 
cursor 指定 画布 中 的 鼠标 指针 ， 例 如 arrow、circle、dot 
tt 指定 画布 的 高 度 
highlightcolor 选中 画布 时 的 背景 色 
Telief 指定 画布 的 边框 样式 ， 可 选 值 有 SUNKEN、RAISED、GROOVE、RIDGE 
scrollregion 指定 画布 的 滚动 区 域 的 元 组 (wan,e,s) 








@ 显示 Canvas 对 象 
显示 Canvas 对 象 的 方法 如 下 : 


Canvas 对 象 .pack () 


例如 创建 一 个 白色 背景 、 宽 300、 高 120 的 画布 。 


from tkinter import * 
root=TKk () 


cv=Canvas (root, bg='white', width=300, height=120) 
cv.create line(10,10,100,80,width=2，dash=7)  ”# 绘 制 直线 


cv.pack() 
root .mainloop () 


# 显 示 画 布 


10.3.2” ”Canvas 上 的 图 形 对 象 








在 Canvas 上 可 以 绘制 各 种 图 形 对 象 ， 通 过 调 上 
。 create_arc(): 绘制 圆 弧 。 

。 create line(): 绘 Gn I 

。 create_bitmap(): 绘制 位 图 。 
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以 下 绘制 函数 实现 。 


返 
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create image(): 绘制 位 图 图 像 。 

。 create_oval(): 绘制 椭圆 。 

。 create_rectangle(): 绘制 矩形 。 

。 create polygon(0: 绘制 多 边 形 。 

。 create window(0: 绘制 子 窗口 。 

。 create_text(): 创建 一 个 文字 对 象 。 

Canvas 上 的 每 个 绘制 对 象 都 有 一 个 标识 ID (整数 )， 在 使 用 绘制 函数 创建 绘制 对 象 时 
回 绘制 对 象 ID。 例 如 : 








idl=cv.create line(10,10,100,80,width=2，dash=7) ， 间 绘 制 直 线 

通过 ID1 可 以 得 到 绘制 对 象 直 线 了 DD。 

在 创建 图 形 对 象 时 可 以 使 用 tags 属性 设置 图 形 对 象 的 标记 (tag)， 例 如 : 
rt=cv.create rectangle(10,10,110,110, tags="'r1') 

上 面 的 语句 指定 矩形 对 象 区 具有 一 个 标记 了 1]。 

用 户 也 可 以 同时 设置 多 个 标记 ， 例 如 : 

rt=cv.create rectangle(10,10,110,110, tags=("rl','r2','r3')) 

上 面 的 语句 指定 矩形 对 象 区 具有 3 个 标记 fl、r2、r3。 

在 指定 标记 后 ， 使 用 find_withtag0 方 法 可 以 获取 到 指定 tag 的 图 形 对 象 ， 然 后 设置 图 





形 对 象 的 属性 。find_withtag0 方 法 的 语法 如 下 : 


Canvas 对 象 .find withtag (tag 名 ) 

find_withtag() 方 法 返回 一 个 图 形 对 象 数 组 ， 其 中 包含 所 有 具有 tag 名 的 图 形 对 象 。 
使 用 itemconfig() 方 法 可 以 设置 图 形 对 象 的 属性 ， 语 法 如 下 : 

Canvas 对 象 .itemconfig (图 形 对 象 ， 属 性 1= 值 1， 属 性 2= 值 2…) 

[ 贺 10-1 使 用 tags 属性 设置 图 形 对 象 标记 。 


from tkinter import * 
root=TKk () 
# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root, bg='white', width=200, height=200) 
# 使 用 tags 给 第 1 个 矩形 指定 3 个 tag 
rt=cv.create rectangle(10,10,110,110, tags=('rl','r2','r3')) 
cv.pack() 
cv.create rectangle(20,20,80,80, tags='r3')# 使 用 tags 给 第 2 个 矩形 指定 一 个 tag 
# 将 所 有 与 tag ('r3' ) 绑 定 的 item 边框 的 颜色 设置 为 蓝 色 
for item in cv.find withtag('"r37) : 
cv.itemconfig (item,outline='blue') 
root .mainloop () 


下 面 学 习 使 用 绘制 函数 绘制 各 种 图 形 对 象 及 对 图 形 对 象 进行 修改 等 操作 。 
@ 绘制 圆 弥 
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使 用 create_arc0 方 法 可 以 创建 一 个 圆 弧 对 象 ， 可 以 是 一 个 弦 、 饼 图 扇 区 或 者 是 一 个 简 
单 的 弧 ， 具 体 语 法 如 下 : 


Canvas 对 象 .create arc ( 弧 外 框 矩形 左上 角 的 x 坐标 ， 弧 外 框 矩形 左上 角 的 y 坐标 ， 弧 外 框 
和 矩形 右 下 角 的 x 坐标 ， 弧 外 框 矩 形 右 下 角 的 y 坐标 ， 选 项 ，. - -) 


创建 圆 弧 时 的 常用 选项 : outline 指定 圆 弧 边框 的 颜色 ，fill 指定 填充 颜色 ，width 指定 
圆 弧 边框 的 宽度 ，start 代表 起 始 角度 ，extent 代表 指定 角度 偏 移 量 而 不 是 终止 角度 。 
[本 102 使 用 create_arc() 方 法 创建 圆 弧 ， 运 行 效果 如 图 10-9 所 示 。 


from tkinter import * 
root=Tk () 
# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root,bg='white') 
cv.create arc((10,10,110,110),) # 使 用 默认 参数 创建 一 个 圆 弧 ， 结 果 为 90” 的 扇形 
d={1:PIESLICE, 2:CHORD, 3:ARC} 
ORGOS 
# 使 用 3 种 样式 ， 分 别 创建 了 扇形 、 马 形 和 弧 形 
Cv.create arc((10,10+60*i,110,110+60*i),style=d[i]) 
print (i,d[i]) 
# 使 用 start/extent 指定 圆 弧 起 始 角 度 与 偏 移 角 度 
cv.create arcl( 
(150,150,250,250) ， 





























SEart 0 # 指 定 起 始 角 度 
extent=120 # 指 定 角度 偏 移 量 ( 逆 时 针 》 
) 

cv.pack() 


root .mainloop () 


























图 10-9 ”创建 圆 弧 


外 绘制 线条 
使 用 create_line0 方 法 可 以 创建 一 个 线条 对 象 ， 具 体 语法 如 下 : 


line=canvas.create line (x0，y0，xl，yl, “…，xn，yn， 选 项 ) 


参数 (x0, y0)，(Cxl, y1)，…，(xn, yn) 是 线段 的 端点 。 
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创建 线段 时 的 常用 选项 : width 指定 线段 宽度 ，arrow 指定 是 否 使 用 箭头 (没有 箭头 为 





none, 起 点 有 箭头 为 first, 终点 有 箭头 为 last, 两 端 有 箭头 为 both), fill 指定 线段 颜色 , dash 
指定 线段 为 虚线 (其 整数 值 决定 虚线 的 样式 )。 























贺 10-3 使 用 create line( 方 法 创建 线条 ， 运 行 效果 如 图 10-10 所 示 。 


from tkinter import * 





Foot=TK() 

cv=Canvas (root，bg='white'，width=200，height=100) 

cv.create line(10, 10, 100, 10, arrow='none') # 绘 制 没 有 箭头 的 线段 
cv.create line(10, 20, 100, 20, arrow="'first') # 绘 制 起 点 有 箭头 的 线段 
cv.create line(10, 30, 100, 30, arrow='last') ## 绘 制 终点 有 箭头 的 线段 
cv.create line(10, 40, 100, 40, arrow='both') # 绘 制 两 端 有 箭头 的 线段 
cv.create line(10,50,100,100,width=3, dash=7) # 绘 制 虚线 

cv.pack() 


Foot .mainloop () 














图 10-10 创建 线条 


@ 绘制 矩形 
使 用 create_rectangle() 方 法 可 以 创建 算 形 对 象 ， 具 体 语 法 如 下 : 


Canvas 对 象 .create_rectangle (矩形 左上 角 的 x 坐标 ， 和 矩形 左上 角 的 y 坐标 ， 和 矩形 右 下 角 
的 x 伦 标 ， 和 矩形 右 下 角 的 y 坐标 ， 选 项 ，. . .) 


创建 矩形 对 象 时 的 常用 选项 : outline 指定 边框 颜色 ,fl 指定 填充 颜色 ，width 指定 边 


框 的 宽度 ，dash 指定 边框 为 虚线 ，stipple 使 用 指定 自 定义 画 刷 填充 矩形 。 














[ 辑 10-4 使 用 create_rectangle() 方 法 创建 矩 形 ， 运 行 效果 如 图 10-11 所 示 。 


from tkinter import * 

Foot=TK() 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg='white', width=200, height=100) 
cv.create rectangle(10,10,110,110, width =2,fill='red') 

# 指 定 矩 形 的 填充 色 为 红色 、 宽 度 为 2 
cV-create_rectangle(120，20，180，80，outline='green')## 指 定 矩 形 的 边框 颜色 为 绿色 
cv.pack() 
root .mainloop () 
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图 10-11 


绘制 多 边 形 














使 





个 多 边 开 


区 ， 具 体 语 法 如 下 : 


创建 矩形 对 象 


create polygon() 方 法 创建 一 个 多 边 形 对 象 ， 可 以 是 一 个 三 角形 、 拢 形 或 者 任意 一 


Canvas 对 象 . create polygon (顶点 1 的 xx 坐标， 顶点 1 的 y 坐 标 ， 顶 点 2 的 x 坐标， 顶点 
2 的 y 坐 标 ，…， 项 点 n 的 x 坐 标 ， 顶 点 n 的 y 坐标 ， 选 项 ，…) 


创建 多 边 形 对 象 时 的 常用 





选项 : outline 指定 边框 颜色 ，fill 指定 填充 颜色 ，width 指定 


边框 的 宽度 ，smooth 指定 多 边 形 的 平滑 程度 (等 于 0 表示 多 边 形 的 边 是 折线 ， 等 于 1 表示 
多 边 形 的 边 是 平滑 曲线 )。 
[ 圆 10-5 创建 三 角形 、 正 方形 、 对 项 三 角形 ， 运 行 效果 如 图 10-12 所 示 。 
from tkinter import * 
root=TKk () 
cv=Canvas (root, bg='white', width=300, height=100) 
cv.create polygon(35,10,10,60,60,60, outline='blue',fill='red', width=2) 


# 等 腰 三 角形 


cv.create polygon(70,10,120,10,120,60,outline='blue', fill="'white',width=2) 


cv.create polygon (130,10,180,10,180,60,130,60, width=4) 
cv.create polygon (190,10,240,10,190,60,240,60, width=1) 


CV. 


pack() 


Foot .mainloop () 


9 
使 有 





ditk 








么 亏 国 驻 


| 











图 10-12 创建 三 角形 、 正 方形 、 对 顶 三 角形 


绘制 椭圆 





肯 create_oval() 方 法 可 以 创建 一 个 李 














对 象 ， 具 体 语法 如 下 : 


# 直 角 三 角形 
# 黑 色 填充 正方 形 
对 项 三 角形 


Canvas 对 象 . create_oval ( 包 竺 椭圆 的 矩形 左上 角 x 坐标 ， 包 里 椭圆 的 矩形 左上 角 y 坐标 ， 包 
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于 椭圆 的 和 矩 形 右 下 角 x 坐标 ， 包 诸 椭 圆 的 算 形 右 下 角 y 坐标 ， 选 项 ，. . .) 

创建 椭圆 对 象 时 的 常用 选项 :outline 指定 边框 颜色 ，fill 指定 填充 颜色 ，width 指定 边 
框 的 宽度 。 如 果 包 奢 椭 圆 的 矩形 是 正方 形 ， 则 绘制 的 是 一 个 圆 形 。 

贺 10-6 创建 椭圆 和 圆 形 ， 运 行 效果 如 图 10-13 所 示 。 


























from tkinter import * 

Foot=TK() 

cv=Canvas (oot，bg='white'，width=200，height=100) 

cv.create oval (10,10,100,50，outline='blue'，fill='red'，width=2)# 彬 圆 
cv.create oval (100,10,190,100，outline='blue'，fil1='red'，width=2)# 圆 形 
cV.pack() 


root .mainloop () 








图 10-13 ”创建 椭圆 和 圆 形 


@ 创建 文字 

使 用 create text( 方 法 可 以 创建 一 个 文字 对 象 ， 具 体 语 法 如 下 : 

文字 对 象 =canvas 对 象 .create text( (文本 左上 角 的 x 坐标 , 文本 左上 角 的 y 坐标 ) ， 选 
2 


创建 文字 对 象 时 的 常用 选项 : text 是 文字 对 象 的 文本 内 容 ，fill 指定 文字 颜色 ，anchor 
控制 文字 对 象 的 位 置 〈 其 取 值 'w' 表 示 左 对 齐 ，' 避 表示 右 对 齐 ，m 表 示 顶 对 齐 ，'s 表 示 底 对 
齐 ，mw' 表 示 左 上 对 齐 ，'sw' 表 示 左 下 对 齐 ，'se' 表 示 右 下 对 齐 ，me' 表 示 右 上 对 齐 ，'center 
表示 居中 对 齐 ，anchor 的 默认 值 为 'center )，justify 设置 文字 对 象 中 文本 的 对 齐 方式 (其 取 
值 left' 表 示 左 对 齐 ，'right' 表 示 右 对 齐 ，'center' 表 示 居 中 对 齐 ，justify 的 默认 值 为 'center')。 
[ 贺 10-7 创建 文本 ， 运 行 效果 如 图 10-14 所 示 。 





from tkinter import * 

Foot=TK() 

cv=Canvas (root, bg='white', width=200, height=100) 

cv.create text((10,10), text='Hello Python', fill='red', anchor='nw') 
cv.create text((200,50), text=" 你 好 ， Python', fill='blue', anchor='se') 
cv.pack() 


root .mainloop () 
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select_from() 方 法 用 于 指定 选中 文本 的 起 始 位 置 ， 具 体 语 法 如 下 : 
Canvas 对 象 .select from (文字 对 象 ， 选 中 文本 的 起 始 位 置 ) 

select to() 方 法 用 于 指定 选中 文本 的 结束 位 置 ， 具 体 语 法 如 下 : 
Canvas 对 象 .select_to (文字 对 象 ， 选 中 文本 的 结束 位 置 ) 

[ 圆 10-8 选中 文本 的 例子 ， 运 行 效果 如 图 10-15 所 示 。 

















from tkinter import * 

root=Tk () 

cv=Canvas (root, bg='white', width=200, height=100) 

txt=cv.create text ((10,10)，text=' 中 原 工学 院 计 算 机 学 院 '，fill='red'，anchor="'nw') 
# 设 置 选中 文本 的 起 始 位 置 

cv.select from(txt,5) 

# 设 置 选 中 文本 的 结束 位 置 

cv.select to (txt, 9) # 选 中 “计算 机 学 院 ” 

cv.pack() 

root .mainloop () 


fk 。 loa 








Hello Python 























图 10-14 创建 文本 图 10-15 选中 文本 


@ 绘制 位 图 和 图 像 
1) 绘制 位 图 
使 用 create_ bitmap() 方 法 可 以 绘制 Python 内 置 的 位 图 ， 具 体 语法 如 下 : 
Canvas 对 象 .create_bitmap( (x 坐标 ,y 坐标 ) ,bitmap= 位 图 字符 串 ， 选 项 ，…) 
(x 坐标 ,y 坐标 ) 是 位 图 放置 的 中 心 坐 标 ,常用 选项 :bitmap、activebitmap 和 disabledbitmap 
分 别 用 于 指定 正常 、 活 动 、 禁 用 状态 显示 的 位 图 。 
2) 绘制 图 像 
在 游戏 开发 中 需要 使 用 大 量 图 像 ， 采 用 create_bitmap0 方 法 可 以 绘制 图 形 图 像 ， 具 体 
语法 如 下 : 
Canvas 对 象 .create image ( (x 坐标 ,y 坐标 ) ，image= 图 像 文 件 对 象 ， 选 项 ，…) 
(x 坐标 ,y 坐标 ) 是 图 像 放 置 的 中 心 坐标 。 常 用 选项 : image、activeimage 和 disabled image 
于 指定 正常 、 活 动 、 禁 用 状态 显示 的 图 像 。 
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注意 : 使 用 PhotoImage0 〇 函数 来 获取 图 像 文件 对 象 。 

img1l=PhotoImage (file= 图 像 文 件 ) 

例如 ，img1=PhotoImage(file='C:\aa.png') 获取 笑脸 图 形 。Python 支持 的 图 像 文件 格式 
一 般 为 png 和 .gif。 

[ 贺 10-9 绘制 图 像 示例 ， 运 行 效果 如 图 10-16 所 示 。 


from tkinter import * 


root=TKk () 

cv=Canvas (root) 

imgl=PhotoImage (file='C:\\aa.png') # 笑 脸 
img2=PhotoImage (file='C:\\2.gif') # 方 块 A 
img3=PhotoImage (file="'C:\\3.gif') # 梅 花 和 A 
cv.create image((100,100) ,image=imgl) # 绘 制 笑脸 
cv.create image((200,100),image=img2) # 绘 制 方块 A 
cv.create image((300,100),image=img3) # 绘 制 梅 花 和 


d={1:'error',2:'info',3:'question',4:'hourglass',5:'questhead', 
6:'warning',7:'gray12',8:'gray25',9:'gray50',10:'gray75'} # 字 典 
#cv.create bitmap((10,220),bitmap=d[1]) 
# 以 下 遍历 字典 绘制 Python 内 置 的 位 图 
For 4 in 0: 
cv.create bitmap((20*i,20),bitmap=d[i]) 
cv.pack() 
root .mainloop () 


tk 
Qi 他 国共 (省 轩 大 


4 人 
‘由 
: VY 





























图 10-16 绘制 图 像 示 例 


在 学 会 绘制 图 像 之 后 ， 就 可 以 开发 图 形 版 的 扑克 牌 、 连 连 看 、 推 箱子 等 游戏 了 。 

和 @@ 修改 图 形 对 象 的 坐标 

使 用 coords() 方 法 可 以 修改 图 形 对 象 的 坐标 ， 有 具体 语法 如 下 : 

Canvas 对 象 . coords (图 形 对 象 ，( 图 形 左 上 角 的 x 坐标， 图 形 左 上 角 的 y 坐标 ， 图 形 右 下 角 的 x 
坐标 ， 图 形 右 下 角 的 y 坐标 ) ) 

因为 可 以 同时 修改 图 形 对 象 的 左上 角 的 坐标 和 右 下 角 的 坐标 ， 所 以 可 以 缩放 图 形 
对 象 。 
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注意 : 如 果 图 形 对 象 是 图 像 文件 ， 则 只 能 指定 图 像 的 中 心 点 坐标 ， 而 不 能 指定 图 像 对 
ene 故 不 能 缩放 图 像 。 
[ 贺 10-10 修改 图 形 对 象 的 坐标 示例 ， 运 行 效果 如 图 10-17 所 示 。 


from tkinter import * 


root=Tk() 

cv=Canvas (root) 

imgl=PhotoImage (file='C:\\aa.png') # 笑 脸 
img2=PhotoImage (file='C:\\2.gif') # 方 块 A 
img3=PhotoImage (file='C:\\3.gif') # 梅 花 R 
rtl=cv.create image((100,100) ,image=imgl) ## 绘 制 笑脸 
rt2=cv.create jimage((200,100) ,image=img2) 间 绘 制 方块 R 
rt3=cv.create jimage((300,100) ,image=img3) 坦 绘 制 梅花 

# 重 新 设置 方块 R (rt2 对 象 ) 的 坐标 

cv.coords (rt2, (200,50)) # 调 整 rt2 对 象 的 位 置 
rt4=cv.create rectangle(20,140,110,220,outline='red', fill="'green') # 正 方形 对 象 
cv.coords (rt4, (100,150, 300, 200)) # 调 整 rt4 对 象 的 位 置 
cv.pack() 


root .mainloop () 





tk 
































图 10-17 调整 图 形 对 象 位 置 之 前 和 之 后 的 效果 


人 @ 移动 指定 图 形 对 象 
使 用 move( 方 法 可 以 移动 图 形 对 象 的 坐标 ， 有 具体 语法 如 下 : 


Canvas 对 象 .move (图 形 对 象 ，zx 坐标 偏 移 量 ，y 坐标 偏 移 量 ) 
贺 10-1 移动 指定 图 形 对 象 示例 ， 运 行 效果 如 图 10-18 所 示 。 


from tkinter import * 


root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg='white', width=200, height=120) 

rtl=cv.create rectangle(20,20,110,110,outline='red', stipple='grayl2', 
fill='green') 














cv.pack() 
rt2=cVv.create rectangle (20,20,110,110,o0utline='blue') 
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cv.move (rt1, 20, -10) # 移 动 rt1 

cv.pack() 

root .mainloop () 

为 了 对 比 移动 图 形 对 象 的 效果 ， 程 序 在 同一 位 置 绘 制 了 两 个 矩形 ， 其 中 和 矩形 rtl 有 背 
景 花纹 ， 拢 形 rt2 无 背景 填充 ， 然 后 用 move() 方 法 移动 rl1， 将 被 填充 的 矩形 rtl 向 右 移 动 
20 像素 、 向 上 移动 10 像素 ， 则 出 现 如 图 10-18 所 示 的 效果 。 

人 @ 删除 图 形 对 象 

使 用 delete 0 方法 可 以 删除 图 形 对 象 ， 具 体 语 法 如 下 : 

Canvas 对 象 .delete (图 形 对 象 ) 

例如 : 

cv.delete (rt1) # 删 除 rtl 图 形 对 象 

@ 缩放 图 形 对 象 

使 用 scale0 方 法 可 以 缩放 图 形 对 象 ， 具 体 语法 如 下 : 

Canvas 对 象 . scale (图 形 对 象 ,x 轴 偏 移 量 , Y 轴 偏 移 量 , x 轴 缩放 比例 ,Y 轴 缩放 比例 ) 

[ 圆 10-12 缩放 图 形 对 象 示例 ， 对 相同 图 形 对 象 放大 、 缩 小 ， 运 行 效果 如 图 10-19 
所 示 。 

from tkinter import * 

root=Tk () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 


cv=Canvas (root, bg='white', width=200, height=300) 
rtl=cv.create rectangle(10,10,110,110,outline='red',stipple='grayl2', 























fill='green') 
rt2=cv.create rectangle(10,10,110,110,outline='green', stipple='grayl2', 


fill='red') 

cv.scale (rt1,0,0,1,2) #Y 方向 放大 一 倍 
cv.scale (rt2,0,0,0.5,0.5) # 缩 小 一 半 大 小 
cv.pack() 


Foot .mainloop () 
































图 10-18 移动 指定 图 形 对 象 运行 效果 图 10-19 缩放 图 形 对 象 运行 效果 
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10.4 程序 设计 的 步骤 


@ 设计 点 类 Point 
点 类 Point 比较 简单 ， 主 要 存储 方块 所 在 棋盘 的 坐标 (x, y)。 














视频 讲解 
class Point: # 点 类 
def init _(self,x,y): 
Se x 
self.y=y 
四 设计 游戏 主 逻 辑 
整个 游戏 在 Canvas 对 象 中 ， 调 用 create_ map0 〇 实现 将 图 标 图 案 随机 放 到 地 图 中 ， 地 图 
map 中 记录 的 是 图 案 的 数字 编号 ， 最 后 调用 print_ map() 按 地 图 map 中 记录 的 图 案 信 息 将 
图 10-2 中 的 图 标 图 案 绘制 在 Canvas 对 象 中 ， 生 成 游戏 开始 的 界面 ， 同 时 绑 定 Canvas 对 象 
的 鼠标 左 键 和 右键 事件 ， 并 进入 窗 体 显示 线程 中 。 
root=TKk () 
root .title ("python 连连 看 ") 
imgs=[PhotoImage (file='H:\\ 连 连 看 \\gif\\bar 0'+str(i)+'.gif') for i in 

















range (0,10)] # 所 有 图 标 图 案 

Select first=False # 是 否 已 经 选中 第 1 块 
firstselectRectId=-1 # 被 选中 第 1 块 地 图 对 象 
SecondSelectRectId=-1 # 被 选中 第 2 块 地 图 对 象 
linePointstack=[] # 存 储 连接 的 折 点 棋盘 坐标 
Line id=[] 

Height=9 

Width=10 


map=[[" " for y in range (Height)]for x in range (Width)] 
image map=[[" " for y in range(Height)]for x in range (Width)] 
cv=Canvas (root, bg='green', width=610, height=610) 
cv.bind("<Button-1>", callback) # 鼠 标 左 键 事 件 
cv.bind("<Button-3>"，find2Block) 才 鼠 标 右键 事件 


cv.pack() 

create map() # 产 生 map 地 图 
print map() # 打 印 map 地 图 
Foot .mainloop () 

@ 编号 函数 代码 





print_map() 按 地 图 map 中 记录 的 图 案 信 息 将 图 10-2 中 的 图 标 图 案 显 示 在 Canvas 对 象 
中 ， 生 成 游戏 开始 的 界面 。 


def print map(): # 输 出 map 地 图 
global image map 











for x in range(0,Width) : 
for y in range (0,Height) : 
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if (map[x] [y] !=" '): 


imgl=imgs [int (map[x] [y])] 
id=cv.create image( (x*40+20,y*40+20),image=img1) 


image map[x] [y]=id 


cv.pack() 


for y in range (0,Height) : 


for x in range(0,Width) : 


print (map[z] [yl],engd=' ') 


print (",",y) 








用 户 在 窗 
置 坐标 (xy)。 前 











中 单 击 时 ， 由 屏幕 像素 坐标 (event.x,event.y) 计 算 被 单 击 方块 的 地 图 棋盘 位 
断 是 否 为 第 1 次 选中 方块 ， 是 则 仅仅 对 选 定 方块 加 上 蓝 色 的 示意 框 线 。 如 


果 是 第 2 次 选中 方块 ， 则 加 上 黄色 的 示意 框 线 ， 同 时 要 判断 是 否 图 案 相 同 且 连通 。 假 如 连 
通则 画 选中 方块 之 间 的 连接 线 , 延 时 0.3 秒 后 清除 第 1 个 选 定 方块 和 第 2 个 选 定 方块 图 案 ， 
并 清除 选中 方块 之 间 的 连接 线 。 假 如 不 连通 ， 则 是 清除 选 定 两 个 方块 示意 框 线 。 

Canvas 对 象 鼠 标 右 键 事 件 调用 智能 查找 功能 Find2Block()。 


def find2Block (event) : # 自 动 查找 


# 见 前 面 程序 设计 的 思路 


Canvas 对 象 鼠 标 左 键 事件 代码 : 


def callback (event): # 鼠 标 左 键 事件 代码 
global Select first,pl,p2 
global firstSelectRectId, SecondSelectRectId 
#print ("clicked at", event.x, event.y,turn) 
x=(event.x)//40 # 换 算 棋盘 坐标 
y=(event.y)//40 


prinE(clicked at™ x> VY 


if map[x] [y]==" ": 
showinfo (title=" 提 示 ",message=" 此 处 无 方块 ") 


else: 


if Select first==False: 


pl=Point (x, y) 

# 画 选 定 (x1, y1) 处 的 框 线 

firstSelectRectId=cv-create_rectangle (x*40, y*40, x*40+40, y*40+ 
40,out1line="blue") 

Select first=True 


下 可 全 


p2=Point (x, y) 
# 判 断 第 2 次 单 击 的 方块 是 否 已 被 第 1 次 单 击 选取 ， 如 果 是 则 返回 
if (pl.x==p2.x) and (pl.y==p2.y): 
return 
# 画 选 定 (x2, y2) 处 的 框 线 
print (' 第 2 次 单 击 的 方块 ', x, y) 
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SecondSelectRectId=cv.create rectangle (x*40,y*40,x*40+40,y*40 
+40,0utline="yellow") 
print (' 第 2 次 单 击 的 方块 ',SecondSelectRectId) 
cv.pack() 
if IsSame (pl,p2) and IsLink (pl,p2) : # 判 断 是 否 连 通 
print (' 连 通 ', x, y) 
Select first=False 


# 画 选中 方块 之 间 的 连接 线 
drawLinkLine (pl,p2) 
t=Timer (timer interval,delayrun) # 定 时 函数 
七 -start () 
else: # 不 能 连通 则 取消 选 定 的 两 个 方块 
cv.delete (firstSelectRectId) # 清 除 第 1 个 选 定 框 线 


cv.delete (SecondSselectRectId) # 清 除 第 2 个 选 定 框 线 
Select first=False 


IsSame(p1.p2) 判 断 pl (x1, y1) 和 p2(x2, y2) 处 的 方块 图 案 是 否 相 同 。 
def IsSame (pl,p2): 
if map[p1.x] [pl.y]==map[p2.x] [p2.y]: 
print ("clicked at IsSame") 
return True 
return False 


以 下 是 画 方块 之 间 的 连接 线 和 清除 连接 线 的 方法 。 

drawLinkLine(p1,p2) 绘 制 (p1,p2) 所 在 两 个 方块 之 间 的 连接 线 。 判 断 linePointStack 列表 
长 度 , 如 果 为 0, 则 是 直接 连通 ; linePointStack 列表 长 度 为 1, 则 是 一 折 连 通 , linePointStack 
存储 的 是 一 折 连 通 的 折 点 ; linePointStack 列表 长 度 为 2， 则 是 两 折 连 通 ，linePointStack 存 
储 的 是 两 折 连 通 的 两 个 折 点 。 


def drawLinkLine (p1,p2) : # 画 连接 线 
if(len(linePointstack)==0): 
Line id.append (drawLine (pl1,p2)) 
S19es 
print (linePointstack, len(linePointstack)) 
if(len(linePointstack)==1): 
z=linePointstack.pop() 
print ("一 折 连 通 点 z",z.x,z.y) 
Line id.append (drawLine (pl,2z)) 
Line id.append (drawLine (p2,z) ) 
if(len(linePointstack)==2): 
zl1=linePointstack.pop() 
print ("两 折 连 通 点 z1", zl1.x,z1.y) 
Line id.append (drawLine (p2,2z1)) 
Zz2=linePointstack.pop() 
print ("两 折 连 通 点 z2", z2.x, z2.y) 
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Line id.append (drawLine(z1,2z2)) 
Line id.append (drawLine (P1,z2) ) 


drawLinkLine(p1,p2) 绘 制 (p1.p2) 之 间 的 直线 。 


def drawLine (pl,p2): 
print ("drawLine pl,p2",pl.x,pl.y,p2.x,p2.y) 
id=cv.create line (pl .x*40+20,pl.y*40+20,p2.x*40+20,p2.y*40+20,width=5, 
fill='red') 
#cv.pack() 
return id 


undrawConnectLine() 删 除 Line_id 记录 的 连接 线 。 


def undrawConnectLine(): 
while len(Line id)>0: 
idpop=Line id.pop() 
cv.delete (idpop) 


clearTwoBlock0 清 除 (p1, p2) 之 间 的 连 线 及 所 在 方块 的 图 案 。 


def clearTwoBlock() : # 清 除 连 线 及 方块 
# 清 除 第 1 个 选 定 框 线 
cv.delete (firstSelectRectId) 
# 清 除 第 2 个 选 定 框 线 
cv.delete(SecondSelectRectId) 
# 清 空 记录 方块 的 值 


map[pl.x] [pl.y]=" " 

cv.delete (image map[pl.x] [pl.y]) 
map[p2.x] [p2.y]=" " 

cv.delete (image map[p2.x] [p2.y]) 
Select first=False 


undrawConnectLine () # 清 除 选 中 方块 之 间 的 连接 线 


delayrun() 函 数 是 定时 函数 ， 延 时 timer interval (0.3 秒 ) 后 清除 p1.p2) 之 间 的 连 线 及 
所 在 方块 的 图 案 。 


timer interval=0.3 #0.3 秒 
def delayrun () : 
clearTwoBlock () # 清 除 连 线 及 方块 


IsWin0 检 测 是 否 尚 有 未 被 消除 的 方块 ， 即 地 图 map 中 的 元 素 值 非 空 《" ")， 如 果 没 有 
则 表示 已 经 赢得 了 游戏 。 


# 检 测 是 否 已 经 赢得 了 游戏 


def IsWin() 
# 检 测 是 否 尚 有 未 被 消除 的 方块 
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#( 非 BLANK STATE 状态 ) 
for y in range (0,Height) : 
for x in range(0,Width) : 
二 下 和 3 到 汪汪 mys 
return False; 
return True; 
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11.1 推 箱子 游戏 介绍 


经 典 的 推 箱子 游戏 是 一 个 来 自 日 本 的 古老 游戏 ， 目 的 是 训练 玩家 的 逻 
辑 思考 能 力 。 该 游戏 的 思想 是 ， 在 一 个 狭小 的 仓库 中 ， 要 求 把 木 箱 放 到 指定 的 位 置 ， 玩 家 
稍 不 小 心 就 会 出 现 箱子 无 法 移动 或 者 通道 被 堵 住 的 情况 ， 所 以 需要 巧妙 地 利用 有 限 的 空间 
和 通道 合理 安排 移动 的 次 序 和 位 置 ， 这 样 才能 顺利 地 完成 任务 。 

推 钉子 游戏 的 功能 如 下 : 

游戏 运行 载 入 相应 的 地 图 ， 屏 幕 中 出 现 一 个 推 箱子 的 工人 ， 其 周围 是 围墙 苇 、 人 可 以 
走 的 通道 图 、 几 个 可 以 移动 的 箱子 鸳 和 箱子 放置 的 目的 地 医 。 让 玩家 通过 按 上 、 下 、 左 、 
右键 控制 工人 萎 推 箱子 ， 当 箱子 都 推 到 了 目的 地 后 出 现 过 关 信 息 ， 并 显示 下 一 关 。 如 果 推 
错 了 ， 玩 家 按 空格 键 重新 玩 过 这 关 ， 直 到 过 完全 部 关卡 。 

本 章 开发 推 箱子 游戏 ， 推 箱子 游戏 界面 如 图 11-1 所 示 。 
4 “推荐 子 -- 夏 敏捷 [一 有 xX | 























图 11-1 推 箱子 游戏 界面 





| 站 本 项 目 案例 开发 
从 入 门 到 实战 一 一 让 虫 、 游 戏 和 机 器 学 习 


本 游戏 使 用 的 图 片 元 素 的 含义 如 下 : 


仿 莒 国 三 网 


目的 地 。 工人 箱子 ”通道 围墙 ”箱子 已 在 目的 地 








11.2 程序 设计 的 思路 





首先 来 确定 一 下 开发 难点 。 对 工人 的 操作 很 简单 ， 就 是 4 个 方向 移动 ， 工 人 移动 ， 箱 
子 也 移动 ， 所 以 对 按键 的 处 理 也 比较 简单 。 当 箱子 到 达 目 的 地 位 置 时 就 会 产生 游戏 过 关 事 
件 ， 需 要 一 个 逻辑 判断 。 仔 细 地 想 一 下 ， 所 有 事件 都 发 生 在 一 张 地 图 中 。 这 张 地 图 包括 了 
箱子 的 初始 化 位 置 、 箱 子 最 终 放置 的 位 置 和 围墙 障碍 等 。 每 一 关 地 图 都 要 更 换 ， 这 些 位 置 
也 要 变 。 所 以 每 关 的 地 图 数据 是 最 关键 的 ， 它 决定 了 每 关 的 不 同 场 景 和 物体 位 置 。 那 么 下 
面 重点 分 析 一 下 地 图 。 

这 里 把 地 图 想象 成 一 个 网 格 ， 每 个 格子 就 是 工人 每 次 移动 的 步 长 ， 也 是 箱子 移动 的 距 
离 ， 这 样 问题 就 简化 多 了 。 首 先 设计 一 个 7x7 的 二 维 列表 myArray， 按 照 这 样 的 框架 来 思 
考 。 对 于 格子 的 x、y 两 个 屏幕 像素 坐标 ， 可 以 由 二 维 列 表 下 标 换算 。 

对 于 每 个 格子 的 状态 值 ， 分 别 用 常量 Wall (0) 代表 墙 、Worker (1) 代表 人 、Box (2) 
代表 箱子 、Passageway (3) 代表 路 、Destination (4) 代表 目的 地 、WorkerInDest (5) 代表 
人 在 目的 地 、RedBox(6) 代表 放 到 目的 地 的 箱子 。 在 文件 中 ， 原 始 地 图 中 格子 的 状态 值 采 
用 相应 的 整数 形式 存放 。 

在 玩家 通过 键盘 控制 工人 推 箱子 的 过 程 中 ， 需 要 按 游戏 规则 判断 是 否 响应 该 按键 指 
示 。 下 面 分 析 一 下 工人 将 会 遇 到 什么 情况 ， 以 便 归 纳 出 所 有 的 规则 和 对 应 算法 。 为 了 描述 
方便 ， 可 以 假设 工人 的 移动 趋势 方向 为 向 右 ， 其 他 方向 的 原理 是 一 致 的 。P1、P2 分 别 代表 
工人 移动 趋势 方向 前 的 两 个 方 格 。 



































@ 前 方 P1 是 通道 

如 果 工 人 前 方 是 通道 ， 工 人 可 以 进 到 P1 方 格 ， 修 改 相关 位 置 格子 的 状态 值 。 

四 前 方 P1 是 围墙 或 出 界 

如 果 工 人 前 方 是 围墙 或 出 界 〈 即 阻挡 工人 的 路 线 )， 退 出 规则 判断 ， 布 局 不 做 任何 
@ 前 方 P1 是 目的 地 

如 果 工 人 前 方 是 目的 地 ， 工 人 可 以 进 到 P1 方 格 ， 修 改 相关 位 置 格子 的 状态 值 。 
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@ 前 方 P1 是 箱子 








a 





在 前 面 3 种 情况 中 ， 只 要 根据 前 方 P1 处 的 物体 就 能 判断 出 工人 是 否 可 以 移动 ， 而 在 
第 4 种 情况 中 ， 需 要 判断 箱子 前 方 P2 处 的 物体 才能 判断 出 工人 是 否 可 以 移动 ， 此 时 有 以 
下 可 能 。 

(1) P1 处 为 箱子 ，P2 处 为 墙 或 出 界 : 如 果 工 人 前 方 Pl 处 为 箱子 ，P2 处 为 墙 或 出 界 ， 
退出 规则 判断 ， 布 局 不 做 任何 改变 。 

(2) P1 处 为 箱子 ，P2 处 为 通道 ,如果 工人 前 方 P1 处 为 箱子 ，P2 处 为 通道 ， 工 人 可 以 
进 到 1 方 格 ，P2 方 格 状态 为 箱子 ， 修 改 相关 位 置 格子 的 状态 值 。 

(3) P1 处 为 箱子 ，P2 处 为 目的 地 : 如 果 工 人 前 方 P1 处 为 箱子 ，P2 处 为 目的 地 ， 工 人 
可 以 进 到 Pl 方 格 ，P2 方 格 状 态 为 放置 好 的 箱子 ， 修 改 相关 位 置 格子 的 状态 值 。 

(4) Pl 处 为 放 到 目的 地 的 箱子 ，P2 处 为 通道 : 如 果 工 人 前 方 Pl 处 为 放 到 目的 地 的 箱 
子 ，P2 处 为 通道 ， 工 人 可 以 进 到 P1 方 格 ，P2 方 格 状态 为 箱子 ， 修 改 相关 位 置 格 子 的 状 
态 值 。 

(5) P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 目的 地 : 如 果 工 人 前 方 Pl 处 为 放 到 目的 地 的 
箱子 ，P2 处 为 目的 地 ， 工 人 可 以 进 到 了 1 方 格 ; P2 方 格 状态 为 放置 好 的 箱子 ， 修 改 相关 位 
置 格子 的 状态 值 。 

综合 前 面 的 分 析 ， 可 以 设计 出 整个 游戏 的 实现 流程 。 


11.3 ”关键 技术 


在 该 游戏 中 设计 “ 重 玩 ” 功 能 便于 玩家 无 法 通过 时 重 玩 此 关 游戏 ， 这 时 需要 将 地 图 信 
息 恢 复 到 初始 状态 , 所 以 需要 将 7x7 的 二 维 列表 myArray 进行 复制 , 注意 此 时 需要 了 解 “ 列 
表 复 制 一 一 深 复 制 ” 问 题 。 

下 面 举 个 例子 。 

问题 描述 : 已 知 一 个 列表 a， 生 成 一 个 新 的 列表 b， 列 表 元 素 是 对 原 列表 的 复制 。 

a=[1,2] 

b=a 

这 种 做 法 其 实 并 未 真正 生成 一 个 新 的 列表 ，b 指向 的 仍然 是 a 所 指向 的 对 象 。 这 样 ， 
如 果 对 a 或 b 的 元 素 进行 修改 ，a、b 列表 的 值 同时 发 生变 化 。 

解决 的 方法 如 下 : 
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| 号 项 目 案例 开发 





从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


2 


b=a[:] # 切 片 ， 或 者 使 用 b=copy-copy(a) 


这 样 修改 a 对 b 没有 影响 ， 修 改 b 对 a 没有 影响 。 

















这 种 方法 只 适用 于 简单 列表 ， 也 就 是 列表 中 的 元 素 都 是 基本 类 型 ， 如 果 列 表 元 素 中 还 





存在 列表 , 这 种 方法 就 不 适用 








了 。 原因 就 是 a[:] 这 种 处 理 只 是 将 列表 元 素 的 值 生成 一 个 新 的 


列表 ， 如 果 列 表 元 素 也 是 一 个 列表 ， 例 如 a=[1.[2]]， 那 么 这 种 复制 对 于 元 素 [2] 的 处 理 只 是 
复制 2] 的 引用 ， 并 未 生成 2] 的 一 个 新 的 列表 复制 。 为 了 证 明 这 一 点 ， 测 试 步骤 如 下 : 


>3> a=[1, [2]] 

>>> b=a[:] 

>>> b 

[1, [2]] 

>>> a[l] .append(3) 
>>> a 

[1, [2, 3]] 

>>> b 

[1, [2, 3]] 


可 见 , 对 a 的 修改 影响 到 了 b。 如 果 要 解决 这 一 问题 ,可 以 使 用 copy 模块 中 的 deepcopyO 


函数 。 修 改 测试 如 下 : 


>>> import copy 

>>> a=[1, [2]] 

>>> b=copy.deepcopy (a) 
>>> b 

[1, [2]] 

>>> a[l] .append (3) 

>>> a 

[1, [2, 3]] 

>>> b 

[1, [2]] 


知道 这 一 点 是 非常 重要 的 ， 因 为 在 本 游戏 中 需要 一 个 新 的 二 维 列表 现在 状态 地 图 )， 
并 且 对 这 个 新 的 二 维 列表 进行 操作 ， 同 时 不 想 影响 原来 的 二 维 列表 原始 地 图 )。 


11.4 程序 设计 的 步骤 





@ 设计 游戏 地 图 


整个 游戏 在 7x7 区 域 中 ， 使 用 二 维 列表 myArray 存储 。 其 中 ， 方 格 状 
态 值 0 代表 墙 ，1 代表 人 ，2 代表 箱子 ，3 代表 路 ，4 代表 目的 地 ，5 代表 也 
人 在 目的 地 ，6 代表 放 到 目的 地 的 箱子 。 例 如 图 11-1 所 示 的 推 箱子 游戏 界 “” 国 闻 开 3 吉 





面 的 对 应 数据 如 下 : 
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方 格 状态 值 采用 myArrayl 存储 (注意 按 列 存储 ): 


# 原 始 地 图 

myArrayl=[[0,3,1,4,3,3,3], 
I0r3nan2rar3nois 
LIONOranor ar 
rsr273no Dnols 
lraAr3r3nar od 
Orgdrar3rar ol 
[0,0,0,0,0,0,0]] 


为 了 明确 表示 方 格 状态 信息 ， 这 里 定义 变量 名 Python 没有 枚 举 类 型 ) 来 表示 ， 并 使 
用 imgs 列表 存储 图 像 ， 而 且 按 照 图 形 代号 的 顺序 储存 图 像 。 


Wall=0 
Worker=1 





Box=2 
Passageway=3 
Destination=4 
WorkerInDest=5 
RedBox=6 
# 原 始 地 图 
myArrayl=[[0,3,1,4,3,3,3], 
L032 a 
[OBO 30 3 00 
Tonal 
LA sao ol 
[ol ee es eh 民 
[0,0,0,0,0,0,0]] 
imgs=[PhotoImage (file='bmp\\Wall .gif"'), 
PhotoImage (file="'bmp\\Worker.gif'), 
PhotoImage (file="'bmp\\Box.gif"'), 
PhotoImage (file='bmp\\Passageway.gif'"'), 
PhotoImage (file='bmp\\Destination.gif'), 
PhotoImage (file='bmp\\WorkerInDest .gif"), 
PhotoImage (file='bmp\\RedBox.gif"')] 
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| 项 目 案例 开 


从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 

@ 绘制 整个 游戏 区 域 图 形 

绘制 整个 游戏 区 域 图 形 就 是 按照 地 图 myArray 储存 图 形 代 号 ， 从 imgs 列表 获取 对 应 
图 像 ， 显 示 到 Canvas 上 。 全 局 变量 x、y 代表 工人 当前 位 置 ， 即 (x,y)， 从 地 图 myArray 读 
取 时 如 果 是 1 (Worker 值 为 1 )， 则 记录 当前 位 置 。 


def drawGameImage () : 

















global x,y 
for i in range(0,7) : #0~6 
for j in range(0,7) : #0~6 
if myArray[i][j]==Worker : 
x=i # 工 人 当前 位 置 (x, y) 
| 
print ("工人 当前 位 置 :", x, y) 
imgl=imgs [myArray [i] [j]] # 从 imgs 列表 获取 对 应 图 像 
cv.create image ((i*32+20,j*32+20) , image=img1) ## 显 示 到 canvas 上 
cv.pack() 
@ 扩 健 事件 处 理 


在 游戏 中 对 于 用 户 按键 的 操作 采用 Canvas 对 象 的 KeyPress 按键 事件 处 理 。KeyPress 
按键 处 理 函 数 callback0) 根 据 用 户 的 按键 消息 计算 出 工人 移动 趋势 方向 前 两 个 方 格 的 位 置 
坐标 (xl, y1)、 (x2, y2), 将 所 有 位 置 作 为 参数 调用 MoveTo(x1, yl, x2, y2) 判 断 并 做 地 图 更 新 。 
如 果 用 户 按 空格 键 ， 则 恢复 游戏 界面 到 原始 地 图 状态 ， 实 现 “ 重 玩 ” 功 能 。 


def callback(event) : # 按 键 处 理 
#(x1，y1)、(x2，y2) 分 别 代表 工人 移动 趋势 方向 前 的 两 个 方 格 
global x,y,myArray 
print (" 按 下 键 : "”) 
print (" 按 下 键 : "，event .char) 
KeyCode=event .keysym 
# 工 人 当前 位 置 (x, y) 
if KeyCode=="Up": # 分 析 按 键 消息 
# 向 上 

Xl1=X; 
Yl=y=1s7 
X2=X; 
Y2=Y-227 
# 将 所 有 位 置 输入 以 判断 并 做 地 图 更 新 
MoveTo (x1, yl, x2, y2); 
# 向 下 


elif KeyCode=="Down": 





Xl1=X; 

Yl=y+1; 

X2=X; 

Y2=Yy+2; 

MoveTo (x1, yl, x2, y2); 
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# 向 左 
elif KeyCode=="Left": 
Xl1=x—1y 
yl=y; 
X2=X-27 
Y2=Y7 
MoveTo (xl1, yl: x2, y2); 
# 向 右 
elif KeyCode=="Right": 
XI1=X+17 
yl=y; 
ZX2=X+23 
V2=Yy7 
MoveTo (x1, yl, x2, y2); 
elif KeyCode=="Space": # 空 格 键 
print (" 按 下 键 : "，event .char) 
myRrray=copy.deepcopy (myRrray1)  # 恢 复原 始 地 图 
drawGameImage () 


IsInGameArea(row, coD) 判 断 是 否 在 游戏 区 域 中 。 


def IsInGameRArea (row, col) 
return (row>=0 and row<7 and col>=0 and col<7) 


MoveTo(x1,y1,x2,y2) 方 法 是 最 复杂 的 部 分 ， 实 现 前 面 分 析 的 所 有 规则 和 对 应 算法 。 


def MoveTo(xl1, yl, x2, y2) 
global x,y 
Pl=None #P1、P2 是 移动 趋势 方向 前 的 两 个 格子 
P2=None 
if IsInGameArea (xl, yl1) : # 判 断 是 否 在 游戏 区 域 
Pl=myArray [x1] [yl1]; 
if IsInGameArea (x2, y2) 
P2=myArray [x2] [y2]; 
if Pl==Passageway : #P1 处 为 通道 
MoveMan (x, y); 
x=x1? y=Y1> 
myArray[x1] [yl1]=Worker; 
if Pl==Destination : #P1 处 为 目的 地 
MoveMan (x, y); 
X=x1; y=y1; 
myArray[x1] [yl1]=WorkerInDest; 
if Pl==Wall or not IsInGameArea (xl, yl1) 
#P1 处 为 墙 或 出 界 
return; 
if Pl==Box : #P1 处 为 箱子 
if P2==Wall or not IsInGameArea (x1，yl) or P2==Box:#P2 处 为 墙 或 出 界 
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| 六 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


return; 
# 以 下 P1 处 为 箱子 
#P1 处 为 箱子 ，P2 处 为 通道 
if Pl==Box and P2==Passageway : 
MoveMan (x, y); 
X=X17 y=yl1; 
myArray [x2] [y2]=Box; 
myArray[x1] [yl1]=Worker; 
if Pl==Box and P2==Destination : 
MoveMan (x, y); 
x=x1; y=yl1; 
myArray[x2] [y2]=RedBox; 
myArray[x1] [yl1]=Worker; 
#P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 通道 
if Pl==RedBox and P2==Passageway : 
MoveMan (x, y); 
=x1? y=Yls 
myArray[x2] [y2]=Box; 
myArray[x1] [yl1]=WorkerIinDest; 
#P1 处 为 放 到 目的 地 的 箱子 ，P2 处 为 目的 地 
if Pl==RedBox and P2==Destination : 
MoveMan (x, y); 
x=x1; y=yl1; 
myArray [x2] [y2]=RedBox; 
myArray[x1] [yl1]=WorkerInDest; 
drawGameImage () 
# 这 里 要 验证 是 否 过 关 
if IsFinish() : 
showinfo (title=" 提 示 ",message=" 恭 喜 你 顺利 过 关 " ) 
ani (lls) 


MoveMan(x,y) 移 走 位 置 为 (x, y) 的 工人 ， 修 改 格子 状 态 值 。 


def MoveMan (x, y) 
if myArray[x] [y]==Worker : 
myArray[x] [y]=Passageway; 
elif myArray[x] [Y]==WorkerInDest : 
myArray[x] [y]=Destination; 


IsFinish() 验 证 是 否 过 关 ， 只 要 方 格 状态 存在 目的 地 (Destination) 或 人 在 目的 地 上 
(WorkerInDest)， 则 表明 有 没 放 好 的 箱子 ， 游 戏 还 未 成 功 ， 否 则 成 功 。 
def IsFinish() : # 验 证 是 否 过 关 
bFinish=True; 


for i in range(0,7) : 非 0 一 6 
Eor 1 in rangel(lOonn) #0~6 
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if (myArray[il] []]==Destination 
or myArray[il] []]==WorkerInDest) : 
bFinish=False; 
return bFinish; 


@ 主 程序 


root=Tk() 

root .title (" 推 箱子 一 夏 敏捷 ") 

cv=Canvas (root, bg="'green', width=226, height=226) 
myArray=copy.deepcopy (myArray1) 


drawGameImage () 

cv.bind("<KeyPress>", callback) 
cv.pack() 

cv.focus set () # 将 焦点 设置 到 cv 上 


root .mainloop() 


至 此 完成 推 箱子 游戏 。 读 者 可 以 考虑 一 下 多 关 推 箱子 游戏 如 何 开发 ， 例 如 把 10 关 游 戏 的 
地 图 信息 存储 在 map.txt 文件 里 ， 需 要 时 从 文件 中 读 取 下 一 关 数 据 即 可 。 
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12.1 麻将 游戏 介绍 


麻将 起 源 于 中 国 ， 它 集 益 智 性 、 趣 味 性 、 博 弈 性 于 一 体 ， 是 中 国 传统 
文化 的 一 个 重要 组 成 部 分 , 不 同 地 区 的 游戏 规则 稍 有 不 同 。 麻 将 牌 每 副 136 张 , 主要 有 “ 饼 
( 文 钱 )”“ 条 ( 索 子 )”“ 万 (万 贯 )” 等 。 与 其 他 牌 形式 相 比 ， 麻 将 的 玩法 最 为 复杂 、 有 趣 ， 
它 的 基本 打 法 简单 ， 因 此 成 为 中 国 历史 上 最 能 吸引 人 的 博 戏 形式 之 一 。 


12.1.1 麻将 术语 


麻将 术语 是 “ 吃 ”“ 碰 ”“ 杠 ”“ 听 ”。 

。 吃 ; 如 果 任 何 一 位 选手 手中 的 牌 的 两 张 加 上 上 家 选手 刚 打 下 的 一 张 牌 恰 好 成 顺 子 ， 
他 就 可 吃 牌 。 

。 碰 ; 如 果菜 方 打出 一 张 牌 , 而 自己 手中 有 两 张 以 上 与 该 牌 相同 的 牌 , 可 以 选择 碰 牌 。 
碰 牌 后 ， 取 得 对 方 打 出 的 这 张 牌 ， 加 上 自己 提供 的 两 张 相同 的 牌 成 为 刻 子 ， 倒 下 这 
个 刻 子 ， 不 能 再 出 。 然 后 再 出 一 张 牌 。“ 碰 ” 比 “ 吃 ”优先 ， 如 果 要 碰 的 牌 刚 好 是 
出 牌 方 下 家 要 吃 的 牌 ， 则 吃 牌 失败 ， 碰 牌 成 功 。 

。 杠 : 其 他 人 打出 一 张 牌 ， 自 己 手中 有 3 张 相 同 的 牌 ， 即 可 杠 牌 。 杠 牌 分 明 杠 和 暗 杠 
两 种 。 

。 听 : 当 将 手中 的 牌 都 凑 成 了 有 用 的 牌 ， 只 需 再 加 上 第 14 张 便 可 和 牌 ， 则 玩家 就 可 
以 进入 听 牌 的 阶段 。 


12.1.2 ”有 牌 数 


麻将 共 136 张 牌 。 








(1) 万 牌 : 
(2) 饼 牌 : 
(3) 条 牌 : 
(4) 风 牌 : 


(5) 字 牌 
本 章 设计 
和 牌 〈 即 胡 牌 
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从 一 万 至 九 万 ， 各 4 张 ， 共 36 张 。 

从 一 饼 至 九 饼 ， 各 4 张 ， 共 36 张 。 

从 一 条 至 九条 ， 各 4 张 ， 共 36 张 。 

东 、 南 、 西 、 北 ， 各 4 张 ， 共 16 张 。 

: 中 、 发、 白 , 各 4 张 , 共 12 张 。 

的 是 两 人 麻将 程序 ， 可 以 实现 玩家 (人 ) 和 计算 机 对 下 。 游 戏 有 吃 、 碰 功能 ， 
) 判断 。 为 了 降低 程序 的 复杂 度 ， 游 戏 没 有 设计 杠 的 功能 。 同 时 对 计算 机 出 


牌 进行 了 智能 设计 ， 游 戏 中 上 方 为 计算 机 的 牌 ， 下 方 为 玩家 的 牌 ， 有 “ 吃 牌 ”“ 碰 牌 ”"”“ 和 
牌 ”“ 摸 牌 ”和 “出 牌 ”按钮 供 玩家 选择 ， 游 戏 初始 界面 如 图 12-1 所 示 。 





Am [els :| 






































图 12-1 两 人 麻将 游戏 运行 的 初始 界面 


12.2 ”两 人 麻将 游戏 设计 的 思路 


12.2.1 


麻将 牌 共 
字 牌 有 东 、 南 


素材 图 片 


136 张 。 万 子 牌 从 一 万 至 九 万 , 饼 子 牌 从 一 饼 至 九 饼 ,条子 牌 从 一 条 至 九条 ， 


、 西 、 北 和 中 、 发 、 白 。 在 设计 时 麻将 牌 图 片 文件 按 以 下 规律 编号 ， 一 饼 至 


九 饼 为 11jpg 一 19jpg， 一 条 至 九条 为 21jpg 一 29jpg， 一 万 至 九 万 为 31.jpg 一 39jpg， 字 牌 
为 41.jpg 一 47jpg， 如 图 12-2 所 示 。 
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| 这 要 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
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PE [三 三 四 五 六 七 ws 九 

计 让 和 时 直言 寺 介 包 

中 发 束 西 南 北 

图 12-2 素材 图 片 
潜 直 和 1: 罗 柜 守 
12.2.2 ”游戏 的 逻辑 实现 
玩家 自己 出 过 牌 ，MyTum=False， 则 轮 到 计算 机 智能 出 牌 ， 计 算 机 出 “国共 8 党 强 

完 牌 则 MyTurm= True， 同 时 “ 摸 牌 ”按钮 有 效 ， 这 样 又 轮 到 玩家 出 牌 。 视频 讲解 


MyTurn=True # 轮 到 玩家 出 牌 
Get btn["state"]=NORMAL # 摸 牌 有 效 


在 游戏 过 程 中 ， playersCard 列表 (数组 ) 记录 两 个 牌 手 的 牌 ， 其 中 playersCard[0] 记 
录 玩 家 自己 (0 号 牌 手 ) 的 牌 ，playersCard[1] 记 录 计 算 机 (1 号 牌 手 ) 的 牌 。 同 理 ， 
playersOutCard 数组 记录 两 个 牌 手 出 过 的 牌 。 所 有 的 牌 存 入 m_aCards 列表 (数组 )， 同 时 
为 了 便于 知道 该 发 哪 张 牌 ， 这 里 k 记录 已 发 牌 的 个 数 ， 从 而 知道 要 摸 的 牌 是 m_aCards[k]。 


12.2.3” 碰 / 吃 牌 的 判断 


在 游戏 过 程 中 玩家 自己 可 以 碰 牌 和 吃 牌 ， 所 以 需要 判断 计算 机 〈1 号 牌 手 ) 刚 出 的 牌 
玩家 是 否 可 以 碰 、 吃 ， 如 果 能 够 碰 、 吃 ， 则 “ 碰 牌 ”“ 吃 牌 ” 和 “ 摸 牌 ”按钮 有 效 。 

能 否 碰 牌 的 判断 比较 简单 ， 由 于 每 张 牌 对 应 文件 的 主 文件 名 是 imageID， 所 以 仅仅 统 
计 相 同 imageID 的 牌 即 可 知道 是 否 有 两 张 以 上 ， 如 果 有 则 可 以 碰 牌 。 

# 是 否 可 以 碰 牌 


def canPeng(a,card) :# (List a,Card card) 
n=0 
for i in range(0,len(a)) : 
c=a[i] 
if(c.imageID==card.imageID) : 
nt= 
if n>=2: 
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return True 
print ("不 能 碰 牌 !!!", card.imageID) 
return False 
能 否 吃 牌 的 判断 也 比较 简单 ， 由 于 牌 手 手 里 的 牌 (a 列表 ) 已 经 排 过 序 了 ， 只 要 判断 
以 下 3 种 情况 : 


1** 





米 ] 水 

来 来 ] 

1 代表 对 方刚 出 的 牌 ， 如 果 符 合 这 3 种 情况 则 可 以 吃 牌 。 
# 是 否 可 以 吃 牌 


def canChi (a,card): 
n=0 
if card.m nType==4: # 字 牌 不 用 判断 吃 
return False 
for i in range(0,1len(a)—1): #1** 
cl=a[i] 
c2=a[i+1] 
if(cl.m nNum==card.m nNum+l and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum+2 and c2.m nType==card.m nType): 
return True 
for i in range(0,1en(a)—-1): #*1* 
cl=a[i] 
c2=a[i+1] 
if(cl.m nNum==card.m nNum-1 and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum+l1 and c2.m nType==card.m nType): 
return True 
for i in range(0,1en(a)—1): #**] 
cl=a[i] 
c2=a[i+1] 
if(cl.m nNum==card.m nNum-2 and cl.m nType==card.m nType 
and c2.m nNum==card.m nNum-1 and c2.m nType==card.m nType): 
return True 
print ("不 能 吃 牌 !!1", card.imageID) 
return False 


12.2.4 ”和 上 牌 算法 


@ 数据 结构 的 定义 回电 
麻将 由 “万 ”“ 饼 ”( 简 ) “条 ”( 索 )“ 字 ”4 类 有 牌 组 成 ， 其 中 “万 ”又 。 ”视频 讲解 
分 为 “一 万 ”~ “ 九 万 ”各 4 张 ， 共 36 张 ,“ 饼 ”和 “条 ”类 似 ,“ 字 ”又 分 为 “ 东 ”“ 南 ” 
“ 西 ”"“ 北 ”“ 中 ”“ 发 "“ 白 ”各 4 张 ， 共 28 张 。 
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Pe 项 目 案例 开发 
从 入 门 到 实战 一 让 虫 、 游 戏 和 机 器 学 习 

这 里 定义 了 一 个 4x10 的 三 维 列 表 ( 相 当 于 其 他 语言 中 的 4x10 的 二 维 数组 
int allPai [4][10])， 它 记录 了 牌 手 手中 的 牌 的 全 部 信息 ， 行 号 记录 类 别 信息 ， 第 0 一 3 行 分 
别 代 表 “ 饼 ”“ 条 ”万 ”“ 字 ”。 

以 第 2 行为 例 ， 它 的 第 0 列 记录 了 牌 中 所 有 “万 ”的 总 数 ， 第 1 一 9 列 分 别 对 应 “一 
万 ”~“ 九 万 ”的 个 数 ,“ 饼 ”和 “条 ”类 似 。“ 字 ”不 同 的 是 第 1 一 7 列 对 应 的 是 “中 ”“ 发 ” 
“和 白 ”“ 东 ”“ 南 ”“ 西 >“ 北 ”的 个 数 ， 第 8、9 列 恒 为 0。 

根据 麻将 的 规则 ， 数 组 中 牌 的 总 数 一 定 为 3n+t2， 其 中 n-0.1.2.3,4。 例 如 有 以 下 数组 : 

allPai=[ 

[6 本 FI 0 3IR 46 个 俩 和 全- 伯 ?9 二 针 ” 三 村 ”和 B35“ 王储 2 
[5,0,2,0,3], # 条 ，5 个 条 牌 ， 两 个 “二 条 ”和 3 个 “四 条 ” 

[0], # 万 ， 无 万 牌 

[S203 # 字 ，3 个 字 牌 “发 ” 

] 

它 表示 牌 手 手 中 的 牌 为 “一 饼 ”“ 二 饼 ”“ 三 饼 ”“ 五 饼 ”“ 五 饼 ”“ 五 饼 ”，“ 二 条 ”“ 二 
条 ”“ 四 条 ”“ 四 条 ”“ 四 条 ”“ 发 "“ 发 "“ 发 ”， 共 6 张 “ 饼 ”5 张 “ 条 ”0 张 “ 万 ”、3 
张 “ 字 ”。 

四 算法 设计 

由 于 “七 对 子 ”“ 十 三 么 ”这 种 特殊 牌 型 的 和 上牌 依据 不 是 牌 的 相互 组 合 ， 而 且 规 则 也 
不 尽 相 同 ， 这 里 将 这 类 情况 排除 在 外 。 

尽管 能 构成 和 牌 的 形式 千变万化 ， 但 稍 加 分 析 可 以 看 出 它 离 不 开 一 个 模型 : 可 以 分 解 
为 “三 、 三 …… 三 、 二 ”的 形式 (总 牌 数 为 3n+2 张 )， 其 中 的 “三 ”表示 的 是 “ 顺 ” 或 “ 刻 ” 
(连续 3 张 牌 叫 作 “ 顺 ” 例如 “三 饼 ”“ 四 人 饼 ”“ 五 饼 ”,“ 字 ”上 牌 不 存在 “ 顺 ”，3 张 同 样 的 
牌 叫 作 “ 刻 ” 例如 “三 饼 ”“ 三 饼 ”“ 三 饼 ”)， 其 中 的 “二 ”表示 的 是 “将 ”( 两 张 相同 的 
牌 可 作为 “将 ” 例如 “三 饼 ”“ 三 饼 ”)。 

在 代码 实现 中 ， 首 先 判 断 牌 手 手中 的 牌 是 否 符合 这 个 模型 ， 这 样 就 用 极 少 的 代价 排除 
了 大 多 数 情况 ， 具 体 方法 是 用 3 除 allPai [i][0] (存储 每 种 牌 型 数量 )， 其 中 i=0, 1, 2,3， 只 
有 在 余数 有 且 仅 有 一 个 为 2， 其 余 全 为 0 的 情况 下 才 可 能 构成 和 上牌 。 

对 于 余数 为 0 的 牌 ， 它 一 定 要 能 分 解 成 一 个 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 这 是 一 个 递归 的 
过 程 ， 由 函数 bool Analyze(lisbbool) 处 理 。 

对 于 余数 为 2 的 牌 ， 一 定 要 能 分 解 成 一 对 “将 ”与 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 由 于 任何 
数目 大 于 等 于 2 的 牌 均 有 作为 “将 ”的 可 能 ， 需 要 对 每 张 牌 进行 轮 询 ， 如 果 它 的 数目 大 于 
等 于 2， 去 掉 这 对 “将 ”后 再 分 析 它 能 否 分 解 为 “ 刻 ” 和 “ 顺 ” 的 组 合 ， 这 个 过 程 的 开销 
相对 较 大 ， 放 在 了 程序 的 最 后 进行 处 理 。 在 递归 和 轮 询 过 程 中 ， 尽 管 每 次 去 掉 了 某 些 牌 ， 
但 最 终 都 会 再 次 将 这 些 牌 加 上 ， 使 得 数组 中 的 数据 保持 不 变 。 

最 后 分 析 递 归 函 数 bool Analyze(listbooD, 列表 (数组 ) 参数 表示 一 类 牌 , 即 “ 万 ”“ 饼 ” 
“条 ”“ 字 ”之 一 ， 布 尔 参 数 指出 列表 (数组 ) 参数 是 否 为 “ 字 ” 牌 ， 这 是 因为 “ 字 ” 牌 只 
能 “ 刻 ” 不能“ 顺 ”。 对 于 列表 〈 数 组 ) 中 的 第 1 张 牌 ， 如 果 要 构成 和 牌 ， 它 就 必须 与 其 他 
牌 构成 “ 顺 ” 或 “ 刻 ”。 
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时 “五 万 ”是 数组 中 
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如 果 数 目 大 于 等 于 3, 那么 它们 一 定 是 以 “ 刻 ” 的 形式 组 合 。 例 如 当前 有 3 张 “ 五 万 ”， 














a 河 








[0 果 它 们 不 构成 “ 刻 ”， 则 必须 有 3 张 “六 万 ” 3 张 “ 七 万 ”与 其 构成 3 个 “ 顺 ”( 注 意 此 
的 第 1 张 牌 )， 否 则 就 会 剩 下 “五 万 ”不 能 组 合 ， 而 此 时 的 3 个 “ 顺 ” 
实际 上 也 是 3 个 “ 刻 ”。 去 掉 这 3 张 牌 ， 递 归 调用 bool Analyze(list,bool) 函 数 ， 如 果 成 功 则 
牌 。 当 该 牌 不 是 字 牌 且 其 下 两 张 牌 均 存 在 时 它 还 可 以 构成 “ 顺 ”， 去掉 这 3 张 牌 , 递归 调 
bool Analyze (list,boo]) 函 数 ， 如 果 成 功 则 和 上牌 。 如 果 此 时 还 不 能 构成 和 牌 ， 说 明 该 牌 不 


与 其 他 牌 顺利 组 合 ， 传 入 的 参数 不 能 分 解 为 “ 顺 ” 和 “ 刻 ” 的 组 合 ， 不 可 以 构成 和 牌 。 
这 里 根据 上 述 思 想 单独 设计 一 个 类 文件 (huMain py) 验证 和 牌 算法 ， 代 码 如 下 : 





class huMain(): 
def _ init _(self): 
# 定 义 牌 手 手中 的 牌 int allPai[4] [10] 


# 构 造 函 数 


Sene alipa lieu A oO oo on Eo 


[3,1,1,1,0,0,0,0,0,0], 
[90,0,0,0,0,0,0,0,0,0], 
[5,2,3,0,0,0,0,0,0,0]] 
if self.Win(self.allPai): 
print ("Hu!\n") 
e158 
print ("Not Hu!\n") 
# 判 断 是 否 和 牌 的 函数 
def Win (self,allPai) : 
jiangPos=0 
jiangExisted=False 
# 是 否 满足 3, 3, 3, 3, 2 模型 
for i in range(0,4) : 
#yushu 
yuSshu=allPai [i] [0]%3 
if YuShu==l : 
return False 
if YuShu==2 : 
if jiangExisted==True: 
return False 
jiangPos=i 


jiangExisted=True 


# 不 含 “ 将 ”处 理 
for i in range(0,4) : 


if i!=jiangPos : 


# 条 


# 万 
# 字 


#“ 将 ”的 位 置 


# 余 数 


# 不 满足 3，3，3，3，2 模型 


# 不 满足 3，3，3，3，2 模型 
#“ 将 ”在 哪 行 


if not self.Analyze(allPai [i],i==3): 


return False 


# 该 类 有 牌 中 要 包含 “将 ”因为 要 对 “将 ”进行 轮 询 ， 效 率 较 低 ， 放 在 最 后 
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success=False # 指 出 除 掉 “ 将 ”后 能 否 通过 
for j in range(1,10) : ## 对 列 进行 操作 ， 用 j 表示 
if(allPai[jiangPos] [j]>=2): 
# 除 去 这 两 张 将 牌 


allPai [jiangPos] [j] -=2 

allPai [jiangPos] [0] -=2 

if self.Analyze (allPai[jiangPos],jiangPos==3) 
success=True 

# 还 原 这 两 张 将 牌 

allPai [jiangPos] [j]+=2 

allPai [jiangPos] [0]+=2 

if success==True : 

break 
return success 


# 分 解 成 “ 刻 ”“ 顺 ”组 合 
def Analyze (self,aKindPai,ziPai): #(int aKindPai[],Boolean ziPai) 

if aKindPai[0]== 
return True 

# 寻 找 第 1 张 牌 

for j in range(1,10) : 
if aKindPai[j]!=0: 

break 

if aKindPai[j]>=3: # 作 为 刻 牌 
# 除 去 这 3 张 刻 牌 
aKindPai[j]-=3 
aKindPai [0] -=3 
result=self.Analyze (aKindPai, ziPai) 
# 还 原 这 3 张 刻 牌 
aKindPai[j]+=3 
aKindPai [0]+=3 
return result 

# 作 为 顺 牌 

if(not ziPai)and(j<8) and (aKindPai[j+1]>0) and (aKindPai [j+2]>0): 
# 除 去 这 3 张 顺 牌 
aKindPai[j]-=1 
aKindPai [j+1] -=1 
aKindPai [j+2] -=1 
aKindPai [0] -=3 
result=self.Analyze (aKindPai, ziPai) 
# 还 原 这 3 张 顺 牌 
aKindPai[j]+=1 
aKindPai [j+1]+=1 
aKindPai [j+2]+=1 
aKindPai [0]+=3 
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return result 


return False 


12.2.5 ”实现 计算 机 智能 出 牌 


在 游戏 中 有 两 个 牌 手 ， 一 个 是 玩家 自己 (0 号 牌 手 )， 一 个 是 计算 机 (1 号 牌 手 )。 如 
果 计 算 机 只 能 随机 出 牌 ， 则 游戏 的 可 玩 性 较 差 ， 所 以 智能 出 牌 是 一 个 设计 重点 。 
为 了 判断 出 牌 ， 需 要 首先 计算 牌 手 手中 各 种 牌 型 的 数量 。 二 维 列表 paiArray 存储 了 和 
牌 算法 的 数据 结构 ,记录 了 牌 手 手中 有 牌 的 全 部 信息 , 行 号 记录 类 别 信 息 , 第 0 一 3 行 分 别 代 
表 “ 饼 ”“ 索 ”“ 万 ”“ 字 ”。 本 游戏 这 里 给 出 一 个 智能 出 牌 的 算法 : 
假设 cards 为 手中 所 有 的 牌 。 
(1) 判断 字 牌 的 单 张 ， 即 paiArray 行 号 为 3 的 元 素 是 否 为 1， 有 则 找到 ， 返 回 在 cards 
的 索引 号 。 
(2) 判断 顺 子 、 刻 子 (3 张 相 同 的 )， 有 则 从 paiArray 中 消去 ， 即 不 需要 考虑 这 些 牌 。 
(3) 判断 单 张 非 字 牌 ( 饼 、 条 、 万 )， 有 则 找到 ， 返 回 在 cards 中 的 索引 号 。 
(4) 判断 两 张 牌 〈 饼 、 条 、 万 ， 包 括 字 牌 )， 有 则 找到 〈 即 拆 双 牌 )， 返 回 在 cards 中 
的 索引 号 。 
(5) 如 果 以 上 情况 均 没 出 现 ， 则 随机 选 出 1 张 牌 ， 当 然 此 种 情况 一 般 不 会 出 现 。 
# 计 算 机 智能 出 牌 v1.0， 计 算出 牌 的 索引 号 
def ComputerCard (cards) : 
# 计 算 牌 手 手中 各 种 牌 型 的 数量 
paiArray=[[0,0,0,0,0,0,0,0,0,0], 
[07050700rD OOOAOTE 
[007070207000FOAO0I 
5070720700207005000I 
for i in range(0,14) : 








card=cards [i] 
if(card.imageID>10 and card.imageID<20): # 饼 
paiArray[0] [0]+=1 
paiArray[0] [card.imageID-10]+=1 
if(card.imageID>20 and card.imageID<30): # 条 
paiArray[1] [0]+=1 
paiArray[l1] [card.imageID-20]+=1 
if(card.imageID>30 and card.imageID<40): # 万 
paiArray[2] [0]+=1 
paiArray[2] [card.imageID-30]+=1 
if(card.imageID>40 and card.imageID<50): # 字 
paiArray[3] [0]+=1 
paiArray[3] [card.imageID-40]+=1 
print (paiArray) 
# 计 算 机 智能 选 牌 
# (1) 判断 字 牌 的 单 张 ， 有 则 找到 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


for j in range(1,10) : 
if (paiArray[3] []]==1) : 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSelectCard (cards,3+1， 到 
return k 
#2) 判断 顺 子 、 刻 子 (3 张 相同 的 
for i in range(0,3): 
for j in range(1,10): 
if (paiArray[i] [j]>=3): # 刻 子 
paiArray[i][j]-=3 
if(j<=7 and paiArray[i][j]>=1 and paiArray[i][j+1]>=1 
and paiRrray[i] [j+2]>=1) : # 顺 子 
paiArray[i][j]-=1 
paiArray[i] [j+1] -=1 
paiArray[i] [j+2] -=1 
# (3) 判断 单 张 非 字 牌 〈 饼 、 条 、 万 )， 有 则 找到 
for i in range(0,3) : 
for j in range(1,10) : 
if (paiArray[i] [j]==1): 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSelectCard (cards, i+1,j) 
return k 
#4) 判断 两 张 牌 ( 饼 、 条 、 万 ， 包 括 字 牌 )， 有 则 找到 ， 拆 双 牌 
for i in range(3,-1): 
for j in range(1,10) : 
if (paiArray[i] []]==2) : 
# 获 取 在 手中 的 牌 的 位 置 下 标 
k=ComputerSelectCard (cards, i+1,j) 


return K 
# (5) 如 果 以 上 情况 均 没 出 现 ， 则 随机 选 出 1 张 牌 
k=random. randint (0,13) # 随 机 选 出 1 张 牌 


return K 
# 根 据 牌 (花色 nType， 点 数 nNum) 找 在 a 数组 中 的 索引 位 置 
def ComputerSselectCard(a, nType,nNum): 
for i in range(0,1len(a)): 
card=a[i] 
if(card.m nType==nType and card.m nNum==nNum): 


return i 
return = 
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12.3 ”关键 技术 
12.3.1 声音 的 播放 


winsound 模块 可 以 访问 由 Windows 平台 提供 的 基本 的 声音 播放 设备 , 它 包 含 数 个 声音 
播放 函数 和 常量 。 

@ Beep(frequency, duration) 函数 

计算 机 蜂 鸣 器 。 其 中 ，frequency 参数 指定 声音 的 频率 ， 单 位 为 赫兹 ， 并 且 必 须 在 37 一 
32767 的 范围 之 中 ; duration 参数 指定 声音 应 该 持续 的 毫秒 数 。 

@ PlaySound(sound, flags) 函 数 

从 Windows 平台 API 中 调用 PlaySound0 函 数 .其 中 , sound 参数 必须 是 一 个 由 文件 名 、 
音频 数据 形成 的 字符 串 ， 或 为 None。 它 的 解释 依赖 于 flags 的 值 ， 该 值 可 以 是 一 个 位 方式 
或 下 面 变 量 的 组 合 。 

。 SND_FILENAME: sound 参数 是 一 个 WAV 文件 的 文件 名 。 

。 SND_LOOP: 重复 地 播放 声音 。 

。 SND_MEMORY: 提供 给 PlaySound() 的 sound 参数 是 一 个 WAV 文件 的 内 存 映像 形 

成 的 字符 串 。 

。 SND_PURGE: 停止 播放 所 有 指定 声音 的 实例 。 

。 SND_ASYNC: 立即 返回 ， 人 允许 声音 异步 播放 。 
。 SND_NOSTOP: 不 中 断 当前 播放 的 声音 。 





























MB _ICONASTERISK: 播放 SystemDefault 声音 。 
MB _ICONEXCLAMATION: 播放 SystemExclamation 声音 。 
例如 播放 八 柄 :wav 声音 文件 的 代码 如 下 : 


import winsound 
winsound.PlaySound ("res\\sound\\ 八 柄 .wav"，winsound. SND_FILENAME) 


12.3.2 ”返回 对 应 位 置 的 组 件 


在 Python Tkinter 中 鼠标 单 击 某 组 件 ， 如 何 得 到 对 应 位 置 的 组 件 呢 ? 

实际 上 ， 当 鼠标 单 击 ， 参 数 event 的 eventx 和 eventy 可 以 获取 鼠标 坐标 的 时 候 ， 
event widget 返回 的 就 是 事件 发 生 时 所 在 的 组 件 ， 也 就 是 被 用 户 单 击 的 组 件 。 

例如 当 用 户 选 麻将 牌 时 ， 系 统 自动 调用 鼠标 按 下 事件 函数 ， 其 中 将 被 单 击 的 麻将 牌 上 
移 20 像素 。 如 果 此 麻将 牌 已 被 选 过 ， 则 下 移 20 像素 恢复 到 原来 的 正常 位 置 。 


def btn MouseDown (event) : # 鼠 标 单 击 按 下 事件 函数 








# 找 到 相应 的 麻将 牌 对 象 
card=event .widget #event .widget 获取 触发 事件 的 对 象 
card.y-=20 # 上 移 20 像素 


card.place (x=event .widget .x,y=event .widget .y) 


233 | 





| 交 项 目 案例 开发 
从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
if(m_ LastCard==None) : 坦 未 选 过 的 牌 
m LastCard=card 
PlayerselectCard=card 
else: # 已 经 选 过 的 牌 
m LastCard.MoveTo (m LastCard.getx(),m LastCard.getY()+20)# 下 移 20 像素 
m LastCard=card 
PlayerSelectCard=card 


12.3.3 ”对 保存 麻将 牌 的 列表 排序 


Python 语言 中 的 列表 排序 方法 有 3 个 ， 即 reverse()( 反 转 /倒序 排序 )、sort()〔 正 序 排 
序 )、sorted0 〈 获 取 排 序 后 的 列表 )， 后 两 种 方法 还 可 以 加 入 条 件 参数 进行 排序 。 

@@ reverse0 方 法 

将 列表 中 的 元 素 倒序 ， 把 原 列表 中 的 元 素 顺序 从 右 至 左 重新 存放 。 例 如 下 面 这 样 : 

>>> [15 23 

>>> x.reverse!() 

>>> 计时 是 [a3 275L] 

@ sort0 方 法 

此 方法 对 列表 内 容 进行 正 向 排序 ， 排 序 后 的 新 列表 会 覆盖 原 列表 (ID 不 变 )， 是 就 地 
排序 ， 以 节约 空间 。 也 就 是 说 ，sort() 排 序 方法 是 直接 修改 原 列表 。 

>>> a nor3rArL2l 

>>> a.sort() 

>>> a EE | 

图 sorted0 方 法 

该 方法 既 可 以 保留 原 列表 ， 又 能 得 到 已 经 排 好 序 的 列表 ， 其 操作 方法 如 下 : 

>>> a=[5,7,6,3,4,1,2] 

>>> b=sorted (a) 


>>> 3 于是 57 7 3 a 1 21 
S>>0B 1 | 


注意 : 使 用 sort() 方 法 和 sorted() 方 法 可 以 加 入 参数 。 


列表 的 元 素 可 以 是 各 种 类 型 ， 例 如 字符 串 、 字 典 、 用 户 自己 定义 的 类 。 如 果 不 使 用 内 
置 比较 函数 ， 可 以 使 用 参数 : 


sort (cmp=None, key=None, reverse=False) 





























sorted (cmp=None, key=None, reverse=False) 


其 中 ，cmp 和 key 都 是 函数 ， 这 两 个 函数 作用 于 列表 的 元 素 上 产生 一 个 结果 ，sorted() 方 法 
根据 这 个 结果 来 排序 。reverse 是 一 个 布尔 值 ， 表 示 是 否 反 转 比较 结果 。 

cmp(el,e2) 是 带 两 个 参数 的 比较 函数 ， 当 返回 值 为 负数 时 el<e2， 为 0 时 el 一 e2， 为 
正 数 时 el>e2， 默 认为 None， 即 用 内 置 的 比较 函数 。 例 如 : 
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>>>students=[(' 张 海 ',20), (' 李 斯 ', 19), (' 赵 大 强 ', 31) , (' 王 硕 ',14)] 
>>>students.sort (cmp=lambda x,y:cmp (x[1],y[1])) # 按 年 龄 数字 大 小 排序 
>>>students 


结果 如 下 : 
DE 20 起 大 直言 3 


key 是 带 一 个 参数 的 函数 ， 用 来 为 每 个 元 素 提取 比较 值 。 其 默认 为 None， 即 直接 比较 
每 个 元 素 。 通 常 ，key 比 cmp 快 很 多 ， 因 为 对 每 个 元 素 ，key 只 处 理 一 次 ， 而 cmp 会 处 
理 多 次 。 例 如 : 


>>>students=[ (" 张 海 ",20)，(" 李 斯 ',19)，(" 赵 大 强 ',31)，(" 王 等 " ,14) 1] 
>>>students.sort (key=lambda X:X[1]) 
>>>students 


结果 如 下 : 

Ea 李斯 "L900 海 20)7 计 (起 大 强 有 3 
用 元 素 已 经 命名 的 属性 做 key: 

students.sort (key=lambda student: student .age) 

用 operator 函数 来 加 快速 度 ， 上 面 的 排序 等 价 于 : 


>>> from operator import itemgetter, attrgetter 





>>> students .sort (key=itemgetter (2) ) 
>>> Students .sort (key=attrgetter('age')) 


说 明 :; cmp 参数 在 Python3.0 以 后 不 再 支持 ， 所 以 Python3.5 只 能 使 用 key、reverse 
参数 。 
在 本 章 中 需要 按 花色 理 牌 手 手中 的 牌 ， 使 用 的 就 是 sort0 排 序 , 参数 key 使 用 的 是 麻将 
牌 的 图 像 ID 属性 。 由 于 麻将 牌 的 图 像 ID 是 有 次 序 的 ， 从 而 实现 按 花色 理 牌 。 
def sortPoker2 (cards) : # 按 花色 理 牌 手 手 中 的 牌 
n=len (cards) # 元 素 〈 牌 ) 的 个 数 
cards.sort (key=operator .attrgetter('imageID') )# 按 麻将 牌 的 图 像 ID 属性 排序 
print ("排序 后 ") 


12.4 ”两 人 麻将 游戏 设计 的 步 又 
12.4.1 ”设计 麻将 牌 类 


Card.as 为 麻将 牌 类 继承 按钮 组 件 Button)， 构 造 函 数 根据 参数 type 
指定 麻将 牌 的 类 型 ， 参 数 num 指定 麻将 牌 的 点 数 。 从 牌 的 类 型 和 牌 的 点 数 
计算 出 对 应 的 麻将 牌 图 片 。 麻 将 牌 的 所 有 图 片 见 图 12-2 所 示 的 素材 。 
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| 下 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


Card 麻将 牌 类 可 以 实现 麻将 牌 正面 、 背 面 的 显示 以 及 移动 的 功能 。 


#Card 麻将 牌 类 
''"m_bFront 表示 是 否 显示 牌 正面 的 标志 
m_nType 表示 牌 的 类 型 饼 =1 条 =2 万 =3 字 牌 =4 
m_nNum 表示 牌 的 点 数 (1 一 9) 
FrontURL 表示 牌 文件 的 URL 路 径 
imageID 表示 牌 自己 的 图 像 编 号 ID 
cardID 表示 牌 自己 在 数组 中 的 索引 ID 
xyY 表示 牌 的 坐标 
# 可 以 实现 麻将 牌 正面 、 背 面 的 显示 以 及 移动 的 功能 
class Card(Button) : 
# 构 造 函数 ， 参 数 type 指定 牌 的 类 型 ， 参 数 num 指定 牌 的 点 数 
def _ init _(self,cardtype,num,bm,master): 
Button._ _init _(self,master) 


self.m nType=cardtype # 牌 的 类 型 饼 =1 条 =2 万 =3 字 牌 =4 

self.m nNum=num # 牌 的 点 数 (1 一 9) 

# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 

if self.m nType==1 : ## 桶 〈 饼 ) 
FrontURL="res/nan/1" 

elif self.m nType== 2 : # 条 


FrontURL="res/nan/2" 

elif self.m nType== 3 : # 万 
FrontURL="res/nan/3" 

elif self.m nType== i # 字 牌 


FrontURL="res/nan/4" 


self.img=bm 
self.imageID=self.m nType * 10 + self.m nNum # 牌 自己 的 图 像 编 号 ID 
FrontURL=FrontURL + str(self.m nNum) #URL 地 址 


FFrontURL=FrontURL + " .png" 
self["width"]=51 # 麻 将 牌 方块 的 宽度 
self["height"]=67 # 麻 将 牌 方块 的 高 度 
self["text"]=str (self.imageID)+".png" 
self.setFront (False) 

#self.MoveTo(100, 100) 
self.bind("<ButtonPress>",btn MouseDown) 
self.cardID=0 


def _ cmp_ _(self, other): 
return cmpl(self.imageID, other.imageID) 
def setFront (self, b): # 是 否 显示 牌 正面 
self.m bFront=b 
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f(D==True): 
self["image"]=self.img 
else: 
self["image"]=back 
def MoveTo(self, xl, yl1): 
self.place (x=xz1, y=y1) 
SOE x XL 
self .y=y1l 
def getX(self) : 
return self.x 
def getY(self) : 
return self.y 
def getImageID (self) : 


return imageID 


12.4.2 ”设计 游戏 主 程序 


导入 包 及 相关 的 类 : 

from tkinter import * 
import random 

from threading import Timer 
import time 

import operator 


import winsound  ”# 声 音 模块 
from tkinter.messagebox import * 


创建 窗口 对 象 ，imgs 用 来 存储 麻将 图 片 。 


win=Tk () 

win.title ("两 人 麻将 一 一 夏 敏 捷 ") 
win.geometry ("995x750") 
imgs=[] 
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# 显 示 牌 正面 图 片 


# 显 示 牌 背面 图 片 
# 移 到 指定 的 (x1，y1) 位 置 


# 牌 的 坐标 


# 牌 自己 的 图 像 编号 ID 


-—-Card end 





# 创 建 窗口 对 象 
# 设 置 窗口 标题 


# 存 储 麻将 的 正面 图 片 


back=PhotoImage (file='res\\bei.png')  # 存 储 牌 的 背面 图 片 


m aCcards=[] 
playersCard=[[],[]] 
playersoutcard=[[],[]] 
k=0 

m LastCard=None 
PlayerSelectCard=None 
MyTurn=True 


# 存 储 136 张 麻将 牌 的 列表 

# 记 录 两 个 牌 手 拿 到 的 牌 

# 记 录 两 个 牌 手 出 过 的 牌 

# 记 录 已 发 出 牌 的 个 数 

# 用 户 是 否 选 过 牌 

# 用 户 选 中 的 牌 

# 轮 到 玩家 出 牌 ( 游 戏 开始 玩家 先 出 牌 ) 


实例 化 “ 吃 牌 ”““ 碰 牌 ”“ 和 牌 ”“ 摸 牌 ”按钮 ， 由 于 还 未 发 牌 ， 所 以 这 些 按钮 均 设置 
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| be 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


# 功 能 按钮 

Get btn=Button (win, text=" 摸 牌 "， command=OnBtnGet Click) 
Peng btn=Button (win, text=" 磁 有 牌 "， command=OnBtnChi Click) 
Chi btn=Button (win, tezxt=" 吃 牌 "，command=OnBtnChi Click) 
Out btn=Button (win,text=" 出 牌 "， command=OnBtnOout Click) 
Win btn=Button (win,text=" 和 牌 "，width=70,height=27) 

Win btn.place (x=500, y=600,width=70, height=27) 

Chi btn.place (x=600, y=600,width=70, height=27) 

Peng btn.place (x=700,y=600,width=70,height=27) 

Out btn.place (x=800,y=600,width=70, height=27) 

Get btn.place (x=900, y=600,width=70, height=27) 


#Get btn.pack forget () # 隐 藏 button 

#Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 碰 牌 ”按钮 无 效 
Chi ptn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Out btn["state"]=DISABLED #“ 出 牌 ”按钮 无 效 
Win btn["state"]=DISABLED #“ 和 有 牌 ” 按 钮 无 效 
BeginGame () # 开 始 游戏 ， 玩 家 先 出 牌 


win.mainloop () 

BeginGame() 函 数 加 载 136 张 麻将 牌 到 舞台 ， 同 时 重 置 游 戏 ， 完 成 洗 牌 功能 ， 即 随机 交 
换 m_aCards 中 的 两 张 牌 ， 并 将 136 张 麻将 牌 的 背面 显示 在 舞台 上 ， 设 置 两 家 26 张 初始 麻 
将 牌 的 位 置 。 


def BeginGame () : # 开 始 游戏 ， 玩 家 先 出 牌 
MyTurn=True 
LoadCards () # 加 载 136 张 麻将 牌 到 舞台 
random. shuffle (m aCards) # 洗 牌 操作 ， 将 列表 中 的 元 素 打 乱 
ResetGame () # 初 始 发 26 张 牌 给 玩家 和 计算 机 
LoadCards() 创 建 136 张 麻将 牌 ， 并 将 牌 添加 到 游戏 舞台 和 m_aCards 列表 〈 数 组 ) 中 。 
def Loadcards () : # 加 载 136 张 麻将 牌 到 舞台 
for m nType in range(1,4) : #1~3 代表 饼 、 条 、 万 
for num in range(1,10) : #1~9 
# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 
if m nType==1: # 桶 〈 饼 ) 
FrontURL="res/nan/1" 
elif m nType==2 : # 条 
FrontURL="res/nan/2" 
elif m nType==3 : # 万 


FrontURL="res/nan/3" 


FrontURL=FrontURL+str (num) #0RL 地 址 
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FrontURL=FrontURL+" .png" 

imgs .append (PhotoImage (file=FrontURL)) 

Emmange(1 5) #1 一 4， 每 种 牌 4 张 
card=Card (m nType, num, imgs [len (imgs) -1] ,win)# 创 建 “ 饼 、 条 、 万 ”上 牌 
#card.MoveTo (100+num*60, 100+m nType*80) 


m aCards .append (card) # 将 牌 添加 到 列表 〈 数 组 ) 
cardtype=4 # 字 牌 
for num in range (1,8) : #1 一 7，7 种 字 牌 
FrontURL="res/nan/4" 
FrontURL=FrontURL+str (num) #0RL 地 址 


FrontURL=FrontURL+" .png" 

imgs .append (PhotoImage (file=FrontURL)) 

for n in range(l, 5) # 每 种 牌 4 张 
card=Card (cardtype, num, imgs [len (imgs)-1],win) # 创 建 字 牌 
#card.MoveTo (100+num*60, 100+4*80) 
#card["state"]=DISABLED 
m aCcards.append (card) # 将 牌 添 加 到 列表 (数组 》 


ResetGame() 在 洗 牌 操作 后 将 136 张 麻 将 牌 的 背面 显示 在 舞台 上 ， 并 完成 发 牌 功能 ， 共 
发 给 两 个 玩家 26 张 麻将 牌 ， 同 时 设置 26 张 初始 麻将 牌 的 位 置 。 


def ResetGame () : # 发 给 两 家 26 张 麻将 牌 
playerscard[0]=[] # 玩 家 手中 的 牌 
playerscard[1]=[] 砷 计算 机 的 牌 
for n in range(0,1en(m aCards)): # 重 新 设置 136 牌 在 场景 中 的 位 置 


m aCards [n] .x=90+20* (ng34) 

m aCards [n] .y=170+55* (n-n%34) /34 

m aCards[n] .MoveTo (m aCards[n] .x, m aCards[n].y) 
#m aCards [n] .setComponentZOrder (m aCards[n], n) 


m aCards[n] .setFront (False) # 显 示 麻 将 牌 的 背面 
# 开 始 发 牌 
Shiftcards () 
m LastCard=None # 上 次 用 户 所 选择 的 卡片 
playersoutcard[0]=[] # 玩 家 出 过 的 牌 
playersoutcard[1]=[] # 计 算 机 出 过 的 牌 


ShiftCards() 发 给 两 个 玩家 26 张 麻将 牌 ， 每 个 玩家 发 完 13 张 牌 以 后 ， 需 要 调用 
sortPoker2(cards) 按 花色 理 牌 手 手中 的 牌 。 


def ShiftCards () : 
global K 
for k in range(0,26) : # 发 牌 ， 设 置 最 初 发 的 26 张 麻将 牌 的 位 置 
Shifti(k) 
print ("玩家 按 花 色 理 手 中 的 牌 ") 
SortPoker2 (playersCard[0]) # 玩 家 按 花 色 理 手中 的 牌 
print ("计算 机 按 花 色 理 手 中 的 牌 ") 
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sortPoker?2 (PlayersCard[1]) # 计 算 机 按 花 色 理 手中 的 牌 
OuterPlayerNum=0 # 出 牌 人 数 为 0 
k=26 # 发 牌 数量 


Shift0) 设 置 最 初 26 张 麻将 牌 的 位 置 ， 并 且 给 发 给 玩家 的 麻将 牌 加 上 "<ButtonPress>" 事 
件 监听 ， 当 单 击 麻将 牌 时 系统 将 调用 btm_ MouseDown(0 事 件 函数 ， 对 发 给 玩家 的 对 家 〈 计 
算 机 ) 的 麻将 牌 则 不 需要 监听 。 


def Shift (k) :  # 设 置 每 张 麻将 牌 的 位 置 
#global Kk 
#print ('running', k) 
i=k%2 
j=(k-k%2) /2 
if i==0 : # 玩 家 自己 
m aCards [k] .setFront (True) # 显 示 麻 将 牌 的 正面 
m aCards[k] .MoveTo (80+55*j, 500) 
# 监 听 每 张 麻将 牌 ， 当 单 击 麻将 牌 时 系统 将 调用 btn_MouseDown () 


m aCards[k] .bind("<ButtonPress>",btn MouseDown) 


elif i==1 : # 玩 家 的 对 家 计算 机 ) 
m aCards[k] .MoveTo (80+55 * j, 80) 
m aCards[k] .setFront (True) # 显 示 麻 将 牌 的 正面 


playersCard[ (ks2) ] .append (m_aCards [K] ) # 按 顺序 存储 到 记录 两 个 牌 手 的 牌 的 数组 


sortPoker2(cards) 按 花色 理 玩家 手中 的 牌 。 由 于 imageID 是 按照 花色 编号 的 ， 所 以 按照 
imageID 大 小 排序 就 可 以 了 。 


def sortPoker2 (cards) : # 按 花色 理 牌 手 手中 的 牌 
n=len (cards) # 元 素 〈 牌 ) 的 个 数 
# 排 序 
cards.sort (key=operator.attrgetter ('imageID')) 
print ("排序 后 ") 
for index in range(0,n): # 重 新 设置 各 张 牌 在 场景 中 的 位 置 


print (cards [index] .imageID) 
newx=90+55*index 

y=cards [index] .getY () 

cards [index] .MoveTo (newx, y) 
cards [index] .cardID=index 


玩家 手中 的 牌 可 以 响应 鼠标 单 击 ， 当 用 户 选 麻将 牌 时 系统 将 调用 btn_ MouseDown() 事 
件 函 数 。 另 外 ， 通 过 event.widget 可 以 获取 用 户 选 的 麻将 牌 对 象 ， 将 此 牌 上 移 20 像素 。 如 
果 已 经 选 过 牌 ， 则 还 需要 将 已 经 选 过 的 牌 下 移 20 像素 。 
# 当 用 户 选 麻将 牌 时 系统 将 自动 调用 此 函数 
def btn MouseDown (event): # 鼠 标 单 击 按 下 事件 函数 
global m LastCard, PlayerSelectCard 


if event.widget["state"]==DISABLED: 
return 
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if(event.widget.m bFront==False): 
return 
# 找 到 相应 的 麻将 牌 对 象 
card=event .widget #event .widget 获取 触发 事件 的 对 象 
card.y-=20 
card.place (x=event .widget .x,y=event .widget.y) 
if(m LastCard==None) : # 未 选 过 的 牌 
m LastCard=card 
PlayerSelectCard=card 
else: # 已 经 选 过 的 牌 
m LastCard.MoveTo (m LastCard.getx(),m LastCard.getY()+20)# 下 移 20 像素 
m LastCard=card 
PlayerSelectCard=card 


以 下 是 4 个 按钮 的 单 击 事件 处 理 。 

在 “ 摸 牌 ”按钮 单 击 事件 中 ,将 m_aCards[k] 牌 移动 到 玩家 牌 所 在 的 位 置 ， 并 按 花 色 排 
序 理 牌 ， 调 用 ComputerCardNum(playersCard[0]) 计 算 玩 家 手中 各 种 牌 型 的 数量 并 判断 是 否 
和 上 牌 ， 如 果 和 上 牌 则 游戏 结束 。 


def OnBtnGet Click() : #“ 摸 牌 ”按钮 事件 
global Kk 
global playersCard,MyTurn 
# 玩 家 按 花 色 理 手中 的 牌 
m aCards[k] .MoveTo (90+55*13, 500) 
m aCards[k] .setFront (True) # 显 示 麻 将 牌 的 正面 
print (" 玩 家 手中 牌 1111", len (Playerscard[0])) 
playerscard[0] .append (m aCards[k]) # 第 14 张 牌 
# 监 听 第 14 张 牌 
m aCards[k] .bind ("<ButtonPress>",btn MouseDown) 
print ("玩家 手中 牌 2222", len (playersCcard[0])) 





sortPoker2 (playersCard[0]) # 按 顺序 存储 到 记录 有 牌 手 的 牌 的 数组 
Fesult1=ComputerCardNum(playersCard[0] )# 计 算 牌 手 手中 各 种 牌 型 的 数量 , 判断 是 否 和 上 牌 
if (result1): # 和 有 牌 了 


Win btn["state"]=NORMAL 
showinfo (title=" 恭 喜 ",message=" 玩 家 Winlm) 


return # 玩 家 不 需要 再 出 牌 
k=k+1 # 下 一 张 要 摸 的 牌 在 m acards 中 的 索引 号 
Out btn["state"]=NORMAL #“ 出 牌 ”按钮 有 效 
Chi ptn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 碰 牌 ”按钮 无 效 
Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 


MyTurn=True 


在 “出 牌 ” 按 钮 单 击 事件 中 ， 将 被 选中 的 牌 PlayerSelectCard 移 到 左 侧 ， 并 从 
playersCard[0] 中 删除 被 选中 的 牌 PlayerSelectCard， 轮 到 计算 机 出 牌 时 ，ComputerOutO 实 
现 计算 机 智能 出 牌 。 





241 | 





bp 项 目 案例 开发 





从 入 门 到 实战 一 一 惟 虫 、 游 戏 和 机 器 学 习 


def OnBtnout Click() : 


global MyTurn 
global PlayerSelectCard,m LastCard,MyTurn 
print ("出 牌 ") 


if (MyTurn==False): # 没 轮 到 自己 出 牌 
return 

if (PlayerSelectCard==None): # 还 没 选择 出 的 牌 
showinfo (title=" 提 示 ",message=" 还 没 选择 出 的 牌 ") 
return 


print (PlayerSelectCard) 
if not(PlayerSelectCard==None): 
Out btn["state"]=DISABLED 才 “ 出 牌 ”按钮 无 效 
playersoutCard[0] .append (PlayerselectCard); 
PlayerSelectCard.x=len (playersoutcard[0])*25-25; # 移 动 被 选中 的 牌 
PlayerSelectCard.y=420; 
PlayerSelectCard.MoveTo (PlayerSelectCard.x, PlayerSelectCard.y); 
#outCcardorder (playersoutcard[0]); ， # 整 理 玩家 出 的 牌 的 z 轴 深 度 
# 玩 家 牌 减少 
print (PlayerSelectCard.cardID) 
del (playersCard[0] [PlayerSelectCard.cardID]) 
#playersCard[0] .remove (PlayerSelectCard); 
m LastCard=None 
PlayerSelectCard=None 
MyTurn=False 
Out btn["state"]=DISABLED 
Computerout () # 计 算 机 智能 出 牌 
fun2 () # 游 戏 顺 序 逻 辑 控制 


对 于 碰 、 吃 牌 ， 这 里 不 再 区 分 处 理 ， 仅 仅 将 对 家 的 牌 加 入 玩家 自己 的 playersCard[0] 
列表 (数组 ) 中 ， 对 playersCard[0] 记 录 的 牌 进行 排序 ， 从 而 达到 理 牌 目的 。 最 后 计算 牌 手 
手中 各 种 牌 型 的 数量 ， 判 断 是 否 和 牌 ， 如 果 和 牌 则 “出 牌 ”按钮 无 效 ， 和 否则 “出 牌 ”按钮 
出 现 ， 玩 家 选择 牌 后 可 以 出 牌 。 

# 对 于 碰 、 吃 牌 ， 这 里 不 再 区 分 处 理 

def onBtnchi click() : #“ 吃 牌 ”按钮 单 击 事件 
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global MyTurn 
card=playersoutCcard[1] [len (playersoutcard[1])-1]; 
card.MoveTo (90+55*13, 500); 


card.setFront (True); # 显 示 麻将 牌 的 正面 
playersCard[0] .append (card); # 第 14 张 牌 
# 监 听 第 14 张 牌 


#card.bind ("<ButtonPress>",btn MouseDown) ， 间 不 绑 定 事件 ， 可 以 防止 此 牌 被 玩家 再 次 出 
print (" 碰 吃 的 牌 是 ",card.imageID) 

SortPoker2 (playersCard[0]); # 按 顺序 存储 到 记录 玩家 的 牌 的 列表 〈 数 组 ) 中 
result1=ComputerCardNum (playerscard[0]) ;# 计 算 牌 手 手中 各 种 牌 型 的 数量 ， 判 断 是 否 和 有 牌 
Tn # 和 有 牌 了 
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Win btn["state"]=NORMAL 
Out btn["state"]=DISABLED 。 才 “ 出 牌 ”按钮 无 效 
showinfo (title=" 恭 喜 ",message=" 玩 家 Winlm) 


return # 玩 家 不 需要 再 出 牌 
Out btn["state"]=NORMAL #“ 出 牌 ”按钮 有 效 
Get btn["state"]=DISABLED #“ 摸 牌 ”按钮 无 效 
chi btn["state"]=DISABLED #“ 吃 牌 ”按钮 无 效 
Peng btn["state"]=DISABLED #“ 碰 牌 ”按钮 无 效 


MyTurn=True 


fun20 实 现 游戏 过 程 中 出 牌 顺序 的 控制 逻辑 。 在 游戏 中 有 两 个 牌 手 ， 一 个 是 玩家 自己 
(0 号 牌 手 ), 一 个 是 计算 机 (1 号 牌 手 )。 在 玩家 出 牌 后 系统 自动 调用 ComputerOut0 实 现 计 
算 机 智能 出 牌 ， 这 时 又 轮 到 玩家 出 牌 ， 需 要 判断 计算 机 出 的 牌 玩家 是 否 可 以 吃 、 碰 ， 如 果 
可 以 ， 则 “ 吃 牌 ”“ 碰 牌 ”按钮 有 效 。 








def fun2(): # 出 牌 顺序 控制 
MyTurn=True # 轮 到 玩家 出 牌 
Get btn["state"]=NORMAL #“ 摸 牌 ”按钮 有 效 


if(len(playersoutCcard[1])>0): 
# 取 计算 机 出 的 牌 ， 即 最 后 一 张 
card=playersOoutCard[1] [len (playersoutCcard[1])-1] 
# 判 断 计 算 机 出 的 牌 玩家 是 否 可 以 吃 、 碰 
if (canPeng (playersCard[0],card)):  # 玩 家 是 否 可 以 碰 牌 


Peng btn["state"]=NORMAL #“ 碰 牌 ”按钮 有 效 
if (canChi (playersCard[0],card)): # 玩 家 是 否 可 以 吃 牌 
Chi btn["state"]=NORMAL #“ 吃 牌 ”按钮 有 效 


# 不 能 吃 、 碰 则 只 能 直接 摸 牌 

if ( not canChi (playersCard[0],card)and not canPeng (playersCard[0], card)): 
Peng btn["state"]=DISABLED 
Chi btn["state"]=DISABLED 


#0nBtnGet Click(); # 直 接 摸 牌 
else: # 计 算 机 没 出 过 牌 直接 摸 牌 
Get btn["state"]=NORMAL #“ 摸 牌 ”按钮 有 效 


为 了 实现 在 不 能 吃 、 碰 的 情况 下 自动 摸 牌 ,不 需要 等 玩家 单 击 “ 摸 牌 ”按钮 后 才 摸 牌 ， 
可 以 将 上 面 的 “直接 摸 牌 ” 行 的 注释 取消 掉 ， 这 样 就 可 以 减少 让 玩家 摸 牌 的 麻烦 ， 但 是 如 
果 可 以 选择 吃 、 碰 ， 这 时 还 是 可 以 让 玩家 单 击 “ 摸 牌 ”按钮 的 ， 因 为 玩家 可 以 放弃 吃 、 碰 。 

ComputerOut(Orderinb 实 现 计算 机 智能 出 牌 ， 首 先 将 m_aCards[k] 牌 移动 到 对 家 
〈 计 算 机 ) 牌 所 在 的 位 置 ， 并 按 花色 排序 理 牌 。 调 用 ComputerCardNum(playersCard[0]) 计 
算 牌 手 手 中 各 种 牌 型 的 数量 并 判断 是 否 和 牌 ， 如 果 和 牌 则 游戏 结束 ， 和 否则 调用 
ComputerCard (playersCard[1]) 智 能 出 牌 。 


def Computerout () : # 计 算 机 智能 出 牌 
global Kk,MyTurn 
# 对 家 (计算机) 摸 牌 
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m aCards[k] .MoveTo (90+55*13,80); 

m aCards[k] .setFront (True); # 显 示 麻 将 牌 正面 

playersCard[1] .append (m_aCards [k] );# 第 14 张 牌 

result1=ComputerCardNum (playersCard[1]);# 计 算计 算 机 的 各 种 牌 型 的 数量 ， 判 断 是 否 和 有 牌 


if (result1): # 和 有 牌 了 

showinfo (title=" 遗 憾 ", message=" 计 算 机 Win!") 

return; ## 对 家 〈 计 算 机 ) 不 需要 再 出 牌 
i=ComputerCard (playersCard[1]); # 智 能 出 牌 
#i=0; # 总 是 出 第 1 张 牌 ， 没 有 智能 出 牌 


card=playersCard[1] [i] 

del (playersCard[1] [i]) 

# 加 到 计算 机 出 过 牌 的 数组 

playersoutCcard[1] .append (card) 

#outCardorder (playersoutcard[1]);  # 整 理 出 过 的 牌 ，z 轴 深 度 问 题 
card.setFront (True); # 显 示 麻 将 牌 正面 

PlaySound (card) # 根 据 计 算 机 出 牌 选 择 声音 文件 播放 
# 计 算 机 按 花 色 理 手中 的 牌 

sortPoker?2 (playersCard[1]); 

card.x=len (playersOutCard[1])*25-25; 


card.y=10; 

card.MoveTo (card.x, card.y); 

k=k+1 # 发 过 牌 的 总 数 
MyTurn=True # 轮 到 玩家 


playSound(card) 实 现 播 放 牌 对 应 的 声音 文件 。 


def playSound (card) : 
#music="res/sound/ 二 条 .wav"; 
# 根 据 牌 的 类 型 及 编号 来 设置 牌 文件 的 路 径 及 文件 名 
music="res/sound/"+toChineseNumstring (card.m nNum); 
if card.m nType==1: # 桶 〈 饼 7 
music+=" 柄 .wav"; 
elif card.m nType==2: # 条 
music+=" 条 .wav"; 
elif card.m nType==3: # 万 
music+=" 万 .wav"; 
elif card.m nType==4: # 字 牌 
music="res/sound/give.wav"; 
winsound.PlaySound (music, winsound.SND FILENAME) 


1 于 声音 文件 名 是 汉字 ， 例 如 “一 万 .mp3”“ 二 万 .mp3”， 所 以 在 计算 机 出 牌 时 
toChineseNumString(n:int) 将 牌 面 的 数字 转换 成 汉字 。 


def tochineseNumString (n) : 
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if n==1: 


music="—" 





music=" 四 " 
elif n==5: 

music=" 五 " 
elif n==6: 





music=" 六 





return music 


def ComputerCardNum(cards) : 


第 12 章 娱乐 游戏 一 一 两 人 麻将 游戏 1 2 


# 玩 家 手中 的 牌 


# 计 算 牌 手 手中 各 种 牌 型 的 数量 

paiArray=[[0,0,0,0,0,0,0,0,0,0], 
ID DA0 SOTDOADRGOAOU 
[LOw00FROOFDOO2DOROAROUN 
RI 

print ("玩家 手中 的 牌 ", len (cards) ) 


for i in range(0,14): 
card=cards [i] 
if(card.imageID>10 
paiArray[0] 
paiArray[0] 
if(card.imageID>20 
paiArray[1] 
paiArray[1] 
if(card.imageID>30 
paiArray[2] 
paiArray[2] 
if (card.imageID>40 
paiArray[3] 
paiArray[3] 
print (paiArray) 





and card.imageID<20): 


0]+=1 
card.imageID-10]+=1 


and card.imageID<30): 


0]+=1 
card.imageID-20]+=1 


and card.imageID<40): 


0]+=1 
card.imageID-30]+=1 


and card.imageID<50): 


013=1 
card.imageID-40]+=1 


# 饼 


# 条 


# 万 


# 字 





在 和 上 牌 算法 中 需要 计算 每 种 花色 麻将 牌 的 数量 以 及 每 种 牌 型 的 数量 ， 
ComputerCardNum(cards) 根 据 cards 计算 出 数据 按 和 牌 的 数据 结构 存 入 paiArray 中 , 调用 和 
牌 算法 类 中 的 Win(paiArray) 判 断 是 否 和 牌 。 
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从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


hu=huMain () # 和 有 牌 算法 类 
result=hu.Win (paiArray) 砷 判断 是 否 和 牌 
return result 


本 两 人 麻将 游戏 还 有 许多 地 方 需要 完善 , 例如 碰 、 吃 牌 功能 ， 需 要 记录 哪 几 张 牌 “ 吃 ” 
和 “ 碰 ”, 这 几 张 牌 不 能 再 出 , 可 以 通过 在 Card 类 里 增加 Selected 属性 来 记录 是 否 用 于 “ 吃 ” 
和 “ 碰 ”, 这样 玩 家 选择 出 牌 时 判断 Selected 属性 的 真 假 就 可 以 知道 是 否 能 出 。 另 外 还 有 “ 杠 ” 
的 处 理 ， 本 游戏 没有 考虑 ， 读 者 可 以 进一步 去 完善 。 本 游戏 的 运行 界面 如 图 12-3 所 示 。 


= 本 












































图 12-3 两 人 麻将 游戏 的 运行 界面 
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13.1 基于 TCP 的 在 线 聊天 程序 简介 


本 章 基 于 TCP 完成 一 个 在 线 聊 天 程序 ， 主 要 功能 是 实现 客户 端 与 服务 器 端的 双向 通 


信 ， 运 行 效果 如 图 13-1 所 示 。 



























Python -RV1 0 
国生 ER 和 褒 户 : 2016-08-02 09:06:22 说 : 
加 反 : 于 2016-03-02 09:05:21 说 : 区 
| 职务: 2016-08-02 09:06:37 说 : 
人 i 吕 D9:06:37 悦 : 很 好 ， 
| 
习 EE 
| 
EE EE 
J 4 
有 | | 天 | El| x | | 














图 13-1 在 线 聊天 的 服务 器 端 与 客户 端 


13.2 ”关键 技术 


13.2.1 互联 网 TCP/IP 协议 
计算 机 为 了 连 网 ， 必 须 规定 通信 协议 ， 早 期 的 计算 机 网 络 都 是 由 各 厂商 自己 规定 一 套 





| 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
协议 ，IBM、Apple 和 Microsoft 公司 都 有 各 自 的 网 络 协议 ， 互 不 兼容 ， 这 就 好 比 一 群 人 有 
的 说 英语 ， 有 的 说 中 文 ， 有 的 说 德语 ， 说 同一 种 语言 的 人 可 以 交流 ， 说 不 同 语言 的 就 不 
行 了 。 

为 了 把 全 世界 的 所 有 不 同类 型 的 计算 机 都 连接 起 来 ， 必 须 规定 一 套 全 球 通用 的 协议 ， 
为 了 实现 互联 网 这 个 目标 , 国际 组 织 制定 了 OSI 七 层 模型 互联 网 协议 标准 ,如 图 13-2 所 示 。 
因为 互联 网 协议 包含 了 上 百 种 协议 标准 ， 但 是 其 中 最 重要 的 两 个 协议 是 TCP 和 了 他 协议 ， 
所 以 大 家 把 互联 网 协议 简称 TCP/IP 协议 。 











| EE | Ed CELED Dod | FETE 
物理 导 





图 13-2 互联 网 协议 


13.2.2 IP 协议 和 端口 


@IPw 议 

在 通信 的 时 候 ， 双 方 必须 知道 对 方 的 标识 ， 这 好 比 发 邮件 必须 知道 对 方 的 邮件 地 址 一 
样 。 互 联网 上 每 台 计 算 机 的 唯一 标识 就 是 卫 地 址 ， 类 似 于 202.196. 32.7。 如 果 一 台 计 算 机 
同时 接 入 到 两 个 或 更 多 的 网 络 ， 例 如 路 由 器 ， 它 就 会 有 两 个 或 多 个 IP 地 址 ， 所 以 IP 地 址 
对 应 的 实际 上 是 计算 机 的 网 络 接口 ， 通 常 是 网 卡 。 

IP 协议 负责 把 数据 从 一 台 计 算 机 通过 网 络 发 送 到 另 一 台 计算 机 。 数 据 被 分 割 成 一 小 
块 、 一 小 块 ,然后 通过 全 包 发 送出 去 。 由 于 互联 网 链 路 复杂 ， 两 台 计 算 机 之 间 经 常 有 多 条 
线路 ， 因 此 路 由 器 就 负责 决定 如 何 把 一 个 人 P 包 转发 出 去 。JP 包 的 特点 是 按 块 发 送 ， 途 经 
多 个 路 由 ， 但 不 保证 能 到 达 ， 也 不 保证 顺序 到 达 。 

卫 地 址 实际 上 是 一 个 32 位 整数 ( 称 为 I Pv4)， 以 字符 串 表示 的 他 地 址 如 192.168.0.1， 
实际 上 是 把 32 位 整数 按 8 位 分 组 后 的 数字 表示 ， 目 的 是 便于 用 户 阅读 。 
IPv6 地 址 实际 上 是 一 个 128 位 整数 ， 它 是 目前 使 用 的 IPv4 的 升级 版 ， 以 字符 串 表 示 ， 
类 似 于 2001:0db8:85a3:0042:1000:8a2e:0370:7334。 

四 端口 

一 个 他 包 除 了 包含 要 传输 的 数据 外 ， 还 包含 源 他 地 址 和 目标 瑟 地 址 、 源 端口 和 目标 
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端口 。 

端口 有 什么 作用 ? 在 两 台 计 算 机 通信 时 只 发 瑟 地 址 是 不 够 的 , 因为 同一 台 计 算 机 上 运 
行 着 多 个 网 络 程序 〈 例 如 浏览 器 、QQ 等 网 络 程序 )。 在 一 个 人 P 包 来 了 之 后 ， 到 底 是 交 给 
浏览 器 还 是 QQ， 需 要 端口 号 来 区 分 。 每 个 网 络 程序 都 向 操作 系统 申请 唯一 的 端口 号 ， 这 
样 两 个 进程 在 两 台 计 算 机 之 间 建 立 网 络 连接 就 需要 各 自 的 瑟 地 址 和 各 自 的 端口 号 。 例如 浏 
览 器 经 常 使 用 80 端口 ，FTP 程序 使 用 21 端口 ， 邮 件 的 收 /发 使 用 25 端 

网 络 上 两 台 计 算 机 之 间 的 数据 通信 ， 归 根 结 底 就 是 不 同 主机 的 进程 交互， 而 每 个 主机 
的 进程 又 对 应 着 某 个 端口 。 也 就 是 说 ， 单 独 靠 人 P 地 址 是 无 法 完成 通信 的 ， 必 须要 有 全 和 
端口 。 


13.2.3 TCP 协议 和 UDP 协议 


TCP 协议 建立 在 人 P 协议 之 上 。TCP 协议 负责 在 两 台 计算 机 之 间 建 立 可 靠 连接 ， 保 证 
数据 包 按 顺序 到 达 。TCP 协议 会 通过 握手 建立 连接 , 然后 对 每 个 全 包 编 号 , 确保 对 方 按 顺 
序 收 到 ， 如 果 包 丢掉 了 ， 就 自动 重 发 。 

许多 常用 的 更 高 级 的 协议 都 是 建立 在 TCP 协议 基础 上 的 , 例如 用 于 浏览 器 的 HTTP 协 
议 、 发 送 邮件 的 SMTP 协议 等 。 

UDP 协议 同样 建立 在 IP 协议 之 上 ， 但 是 UDP 协议 面向 无 连接 的 通信 协议 ， 不 保证 数 
据 包 的 顺利 到 达 ， 是 不 可 靠 传 输 ， 所 以 效率 比 TCP 要 高 。 


13.2.4 Socket 


Socket 是 网 络 编程 的 一 个 抽象 概念 。Socket 是 套 接 字 的 英文 名 称 ， 主 要 是 用 于 网 络 通 
信 编 程 。 在 20 世纪 80 年 代 初 ， 美 国政 府 的 高 级 研究 工程 机 构 “ARPA) 给 加 利 福 尼 亚 大 
学 的 Berkeley 分 校 提供 了 资金 ， 让 他 们 在 UNIX 操作 系统 下 实现 TCP/IP 协议 。 在 这 个 项 
目 中 , 研究 人 员 为 TCP/IP 网 络 通 信 开 发 了 一 个 API( 应 用 程序 接口 ), 这 个 API 称 为 Socket 
( 套 接 字 )。Socket 是 TCP/IP 网 络 最 为 通用 的 API， 任 何 网 络 通信 都 是 通过 Socket 来 完 
成 的 。 

通常 用 一 个 Socket 表示 “打开 了 一 个 网 络 链接 ”， 而 打开 一 个 Socket 需要 知道 目标 计 
算 机 的 卫 地 址 和 端口 号 ， 再 指定 协议 类 型 。 

套 接 字 构造 函数 socket(family,type[,protocol]) 使 用 给 定 的 套 接 字 家 族 、 套 接 字 类 型 、 协 
议 编号 来 创建 套 接 字 。 

其 参数 如 下 。 

。 family: 套 接 字 家 族 ， 可 以 是 AF_UNIX 或 者 AF_INET、AF _INET6。 

。 type: 套 接 字 类 型 ， 可 以 根据 是 面向 连接 的 还 是 非 连接 的 分 为 SOCK_STREAM 和 

SOCK_DGRAM。 
。 protocol: 一 般 不 填 ， 默 认为 0。 
参数 的 取 值 的 含义 见 表 13-1。 
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从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


表 13-1 参数 的 取 值 含义 


参数 描述 





socket.AF UNIX 只 能 够 用 于 单一 的 Unix 系统 进程 间 通 信 





socket.AF INET 
socket.AF INET6 


服务 器 之 间 的 网 络 通信 
IPv6 





socket.SOCK_ STREAM 流 式 Socket， 针 对 TCP 





socket.SOCK DGRAM 数据 报 式 Socket， 针 对 UDP 





原始 套 接 字 , 首先， 普通 的 套 接 字 无 法 处 理 ICMP、IGMP 等 网 络 
报 文 ， 而 SOCK RAW 可 以 ; 其 次 ，SOCK RAW 也 可 以 处 理 特 
殊 的 IPv4 报 文 ; 此 外 ,利用 原始 套 接 字 , 可 以 通过 IP_HDRINCL 
套 接 字 选 项 由 用 户 构造 他 头 


socket.SOCK RAW 








socket.SOCK SEQPACKET 可 靠 的 连续 数据 包 服 务 

例如 创建 TCP Socket: 

s=socket .socket (socket .AF INET, socket.SOCK STREAM) 
创建 UDP Socket: 


s=socket .socket (socket .AF INET, socket .SOCK DGRRM) 


Socket 同时 支持 数据 流 Socket 和 数据 报 Socket。 图 13-3 是 面向 连接 支持 数据 流 TCP 
的 时 序 图 。 
















































































服务 器 
Socket() 
了 
Bind() 
! 客户 机 
Listen() 
Socket() 
阳 赛 ， 等 待 客户 数据 建立 连接 1 
| Connect() 
Accept() 
! 请 求 数据 1 
Recieve() Send() 
服务 器 处 理 请 求 
应 答 数据 
Send() ~ Recieve() 
¥ 1 
Close0) Close() 




















图 13-3 面向 连接 TCP 的 时 序 图 
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由 该 图 可 以 看 出 ， 客 户 机 (Client) 与 服务 器 (Server) 的 关系 是 不 对 称 的 。 
对 于 TCP C/S， 服 务 器 首先 启动 ， 然 后 在 某 一 时 刻 启 动 客户 机 与 服务 器 建立 连接 。 服 
务 器 与 客户 机 开始 都 必须 调用 Socket0 建 立 一 个 套 接 字 ， 然 后 服务 器 调用 Bind0 将 套 接 字 
与 一 个 本 机 指定 端口 绑 定 在 一 起 ， 再 调用 Listen0 使 套 接 字 处 于 一 种 被 动 的 准备 接收 状态 ， 
这 时 客户 机 建立 套 接 字 便 可 以 通过 调用 Connect0 和 服务 器 建立 连接 ， 服 务 器 就 可 以 调用 
Accept() 来 接收 客户 机 连接 。 然 后 继续 监听 指定 端口 ， 并 发 出 阻塞， 直到 下 一 个 请 求 出 现 ， 
从 而 实现 多 个 客户 机 连接 。 在 连接 建立 之 后 ， 客 户 机 和 服务 器 之 间 就 可 以 通过 连接 发 送 和 
接收 数据 。 最 后 ， 待 数据 传送 结束 ， 双 方 调用 Close0 关 闭 套 接 字 。 
在 Python 的 Socket 模块 中 Socket 对 象 提供 的 函数 如 表 13-2 所 示 。 
表 13-2 ”Socket 对 象 的 函数 
函数 描述 
服务 器 端 套 接 字 函数 



































绑 定 地 址 (hosbport) 到 套 接 字 ,在 AF_INET 下 以 元 组 (host,port) 的 形式 
s.bind(host,port) 表示 地 址 


开始 TCP 监听 。backlog 指定 在 拒绝 连接 之 前 可 以 的 最 大 连接 数量 。 该 值 至 


De 少 为 1， 大 部 分 应 用 程序 设 为 5 就 可 以 了 
s.accept() 被 动 接受 TCP 客户 端 连接 , (阻塞 式 ) 等 待 连接 的 到 来 
客户 喘 套 接 字 函数 


主动 与 TCP 服务 器 连接 。 一 般 address 的 格式 为 元 组 (hostname,port)， 如 
果 连 接 出 错 ， 返 回 socket.error 错误 
connect0 函 数 的 扩展 版 本 ， 出 错时 返回 出 错 码 ， 而 不 是 抛 出 异常 


s.connect(address) 








s.connect ex() 
公共 用 途 的 套 接 字 函 数 
- 接收 TCP 数据 , 数据 以 字 节 中 形式 返回 .bufsize 指定 要 接收 的 最 大 数据 量 。 

srecv(bufsize,Lflag]) flag 提供 有 关 消 息 的 其 他 信息 ， 通 常 可 以 忽略 

发 送 TCP 数据 ， 将 data 中 的 数据 发 送 到 连接 的 套 接 字 。 其 返回 值 是 要 发 送 
iets) 的 字 节 数量 ， 该 数量 可 能 小 于 data 的 字 节 大 小 
完整 发 送 TCP 数据 ， 将 data 中 的 数据 发 送 到 连接 的 套 接 字 ， 但 在 返回 之 前 
会 尝试 发 送 所 有 数据 。 如 果 成 功 ， 返 回 None， 如 果 失 败 ， 抛 出 异常 
_ 接收 UDP 数据 ， 与 recv0 类 似 ， 但 返回 值 是 (data,address)。 其 中 ，data 是 
srecvform(bufsize,[flag]) | 包含 接收 数据 的 字 节 串 ，address 是 发 送 数据 的 套 接 字 地 址 

发 送 UDP 数据 ， 将 数据 发 送 到 套 接 字 ，address 是 形式 为 (ip,port) 的 元 组 ， 














s.sendall(data) 






























































ssendto(data,address) | 指定 远程 地 址 。 其 返回 值 是 发 送 的 字 节 数 
s.close() 关闭 套 接 字 
s.getpeername() 返回 连接 套 接 字 的 远程 地 址 ， 其 返回 值 通常 是 元 组 〈ipaddrport) 
s.getsockname() 返回 套 接 字 自己 的 地 址 ， 通 常 是 一 个 元 组 (ipaddr,port) 
s.setsockopt(level, 汶 因 从 全 i 也 
Se 设置 给 定 套 接 字 选项 的 值 
s.getsockopt(level, 返回 套 接 字 选项 的 什 
optname) 
设置 套 接 字 操作 的 超时 时 间 , timeout 是 一 个 浮 点 数 , 单位 是 秒 。 其 值 为 None 
s.settimeout(timeout) 表示 没有 超时 时 间 。 一 般 情况 下 ， 超 时 时 间 应 该 在 刚 创 建 套 接 字 时 设置 ， 
因为 它们 可 能 用 于 连接 操作 (例如 connectO) 
s.gettimeout() 返回 当前 超时 时 间 的 值 ， 单 位 是 秒 ， 如 果 没 有 设置 超时 期 ， 则 返回 None 
s.filenoO) 返回 套 接 字 的 文件 描述 符 
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函数 描述 
如 果 flag 为 0, 则 将 套 接 字 设 为 非 阻塞 模式 , 否则 将 套 接 字 设 为 阻塞 模式 ( 默 
s.setblocking(flag) 认 值 )。 在 非 阻 塞 模式 下 ,如 果 调 用 recv0 没 有 发 现任 何 数据 , 或 sendO 调 用 
无 法 立即 发 送 数据 ， 那 么 将 引起 socket.error 异常 
s.makefile() 创建 一 个 与 该 套 接 字 相 关联 的 文件 





在 了 解 了 TCP/IP 协议 的 基本 概念 以 及 IP 地 址 、 端 口 的 概念 和 Socket 之 后 ， 就 可 以 开 


始 进 行 网 络 编程 了 。 


[ 圆 13-1 编写 一 个 简单 的 TCP 服务 器 程序 ， 它 接收 客户 端 连接 ， 把 客户 端 发 过 来 的 


字符 串 加 上 "Hello" 再 发 回去 。 





完整 的 TCP 服务 器 端 程序 如 下 : 
import socket # 导 入 socket 模块 
import threading # 导 入 threading 线程 模块 


def tcplink(sock, addr): 
print (' 接 收 一 个 来 自 $s:%s 连接 请 求 ' s addr) 


sock.send(b'Welcome!') # 发 给 客户 端 Welcome ! 信 息 
while True: 
data=sock.recv (1024) # 接 收 客户 端 发 来 的 信息 
time.sleep (1) # 延 时 1 秒 钟 
if not data or data.decode ('utf-8')—'exit': # 加 果 没 数据 或 收 到 “exit” 信 息 
break # 终 止 循环 
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8')) 
# 收 到 信息 加 上 Hello 发 回 
sock.close() # 关 闭 连接 


print (' 来 自 $s:%s 连接 关闭 了 .' % addr) 
Ss=socket . socket (socket .AF INET， socket.SOCK STREAM) 


s.bind(('127.0.0.1', 8888)) # 监 听 本 机 8888 端口 
s.listen(5) # 连 接 的 最 大 数量 为 5 


print (' 等 待 客户 端 连接 ...') 


while True: 


sock, addr=s.accept () # 接 受 一 个 新 连接 
# 创 建新 线程 来 处 理 TCP 连接 

t=threading.Thread (target=tcplink, args=(sock, addr)) 

七 .Start () 


在 程序 中 首先 创建 一 个 基于 IPv4 和 TCP 协议 的 Socket: 


s=socket .socket (socket .AF INET, socket.SOCK STREAM) 





然后 绑 定 监 听 的 地 址 和 端口 。 服 务 器 可 能 有 多 块 网 卡 ， 可 以 绑 定 到 某 一 块 网 卡 的 人 P 
地 址 上 ， 也 可 以 用 0.0.0.0 绑 定 到 所 有 的 网 络 地 址 ， 还 可 以 用 127.0.0.1 绑 定 到 本 机 地 址 。 
127.0.0.1 是 一 个 特殊 的 下 地址, 表示 本 机 地 址 ， 如 果 绑 定 到 这 个 地 址 ， 客 户 端 必须 同时 在 





本 机 运行 才能 连接 ， 也 就 是 说 ， 外 部 的 计算 机 无 法 连接 进来 。 
端口 号 需要 预先 指定 。 因 为 这 里 写 的 这 个 服务 不 是 标准 服务 ， 所 以 用 8888 这 
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号 。 注 意 ， 小 于 1024 的 端口 号 必须 要 有 管理 员 权限 才能 绑 定 。 


# 监 听 本 机 8888 端口 
Sepbina( (2 OO 1898) 


接着 调用 listen0 方 法 开始 监听 端口 ， 传 入 的 参数 指定 等 待 连接 的 最 大 数量 为 5: 


s.listen(5) 
print (' 等 待 客户 端 连接 . . .') 


接 下 来 ,服务 器 程序 通过 一 个 无 限 循 环 接受 来 自 客户 端的 连接 ，accept() 会 等 待 并 返回 
一 个 客户 端的 连接 。 
while True: 
# 接 受 一 个 新 连接 
sock，addr=s.accept ()#sock 是 新 建 的 Socket 对 象 ， 服 务 器 通过 它 与 对 应 客户 端 通 
# 信 ，aqqr 是 IP 地 址 
# 创 建新 线程 来 处 理 TCP 连接 
t=threading.Thread (target=tcplink, args=(sock, addr)) 
testart() 


每 个 连接 都 必须 创建 新 线程 (或 进程 ) 来 处 理 ， 否 则 单线 程 在 处 理 连接 的 过 程 中 无 法 
接受 其 他 客户 端的 连接 : 


def tcplink(sock, addr): 
print (' 接 收 一 个 来 自 $s:%s 连接 请 求 ' s adqr) 

















sock.send(b'Welcome!') # 发 给 客户 端 “Wwelcome ! ”信息 
while True: 
data=sock.recv (1024) # 接 收 客户 端 发 来 的 信息 
time.sleep (1) # 延 时 1 秒 钟 
if not data or data.decode ('utf-8')=='exit' :# 如 果 没 数据 或 收 到 'exit ' 信 息 
break # 终 止 循环 


sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8')) 
# 收 到 信息 加 上 “Hel1lo” 发 回 
sock.close() # 关 闭 连接 
print (' 来 自 $s:%s 连接 关闭 了 .' % addr) 


在 连接 建立 后 ， 服 务 器 首先 发 一 条 欢迎 消息 ， 然 后 等 待 客户 端 数 据 ， 并 加 上 “Hello” 
发 送 给 客户 端 。 如 果 客 户 端 发 送 了 exit 字符 串 ， 就 直接 关闭 连接 。 
如 果 要 测试 这 个 服务 器 程序 ， 还 需要 编写 一 个 客户 端 程序 : 





二 











import socket # 导 入 socket 模块 
Ss=socket . socket (socket .AF INET, socket.SOCK STREAM) 

s.connect (('127.0.0.1', 8888)) ## 建 立 连 接 

# 打 印 接收 到 欢迎 消息 


print (s.recv(1024) .decode ('utf-8')) 

for data in [b'Michael', b'Tracy', b'sSarah']: 
s.send (data) # 客 户 端 程序 发 送 人 名 数据 给 服务 器 端 
print (s.recv(1024) .decode ('utf-8')) 
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s.send(b'exit') 


s.close() 

打开 两 个 命令 行 窗口 ， 一 个 是 运行 服务 器 端 程序 ， 另 一 个 是 运行 客户 端 程序 ， 就 可 以 
看 到 运行 效果 ， 如 图 13-4 和 图 13-5 所 示 。 
Fa, CMWindows\py.exe L ed x 








图 13-4 服务 器 程序 效果 


/2. C\Windows\py.exe 


Melcome? 
» Michael9 








图 13-5 客户 端 程序 效果 





的 是 ， 客 户 端 程序 运行 完毕 就 退出 了 ， 而 服务 器 程序 会 永远 运行 下 去 ， 必 须 
按 Ctrl+C 组 合 键 退 出 程序 。 
可 见 ， 用 TCP 协议 进行 Socket 编程 在 Python 中 十 分 简单 ， 对 于 客户 端 ， 要 主动 连接 
服务 器 的 IP 和 指定 端口 ， 对 于 服务 器 ， 要 首先 监听 指定 端口 ， 然 后 对 每 一 个 新 的 连接 创建 
-个 线程 或 进程 来 处 理 。i 服务 器 程序 会 无 限 运 和 :。 另 外 还 ， 同 一 个 端口 
被 一 个 Socket 绑 定 了 以 后 就 不 能 被 其 他 Socket 绑 定 了 。 


13.2.5 “多 线程 编程 


线程 是 操作 系统 可 以 调度 的 最 小 执行 单位 ， 能 够 执行 并 发 处 理 。 通 常 是 将 程序 拆 分 成 
两 个 或 多 个 并 发 运行 的 线程 ， 即 同时 执行 多 个 操作 。 例 如 ， 在 使 用 线程 的 同时 监视 用 户 并 
发 输入 ， 并 执行 后 台 任务 等 。 

threading 模块 提供 了 Thread 类 来 创建 和 处 理 线 程 ， 格 式 如 下 : 

线程 对 象 =threading.Thread (target= 线 程 函 数 ,args=( 参 数列 表 )， name= 线 程 名 ， 

group= 线 程 组 ) 

第 一 个 参数 是 函数 名 ， 第 二 个 参数 args 是 一 个 元 组 ， 线 程 名 和 线程 组 都 可 以 省 略 。 

Thread 类 还 提供 了 以 下 方法 。 


A 
需要 
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run(): 用 于 表示 线程 活动 的 方法 。 
start(): 启动 线程 活动 。 
join([time]): 可 以 阻塞 进程 ， 直 到 线程 执行 完毕 。 参 数 time 指定 超时 时 间 (单位 为 
秒 )， 超 过 指定 时 间 join 就 不 再 阻塞 进程 了 。 
isAlive(): 返回 线程 是 否 活动 。 
getName0: 返回 线程 名 。 
setName(): 设置 线程 名 。 
threading 模块 提供 的 其 他 方法 如 下 : 
。 threading.currentThread(): 返回 当前 的 线程 变量 。 
。 threading.enumerate(): 返回 一 个 包含 正在 运行 的 线程 的 list。 正 在 运行 指 线程 启动 
后 、 结 束 前 ， 不 包括 启动 前 和 终止 后 的 线程 。 
。 threading.activeCount(): 返回 正在 运行 的 线程 数量 , 与 len(threading.enumerate()) 有 相 
同 的 结果 。 
[加 132 编写 自己 的 线程 类 myThread 来 创建 线程 对 象 。 
分 析 : 自己 的 线程 类 直接 从 threading.Thread 类 继承 ， 然 后 重 写 init 0 方法 和 ran() 
方法 就 可 以 创建 线程 对 象 了 。 

















import threading 
import time 
exitFlag=0 
class myThread (threading.Thread) : “## 继 承 父 类 threading.Thread 
def _ init _(self, threadID, name, counter): 
threading.Thread. _init _(self) 
self.threadID=threadID 
self.name=name 
self.counter=counter 
def run (self) :# 把 要 执行 的 代码 写 到 run () 函数 里 面 ， 线 程 在 创建 后 会 直接 运行 run () 函数 
print ("starting "+self.name) 
print time(self.name, self.counter, 5) 
print ("Exiting "+self.name) 
def print time (threadName, delay, counter): 
while counter: 
if exitFlag: 
thread.exit () 
time.sleep (delay) 
print ("$s: %s"%(threadName, time.ctime (time.time()))) 
counter-=1 
# 创 建新 线程 
threadl=myThread (1, "Thread-1", 1) 
thread2=myThread (2, "Thread-2", 2) 
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# 开 启 线程 

thread]l .start () 

thread2 .start () 

print ("Exiting Main Thread") 


以 上 程序 的 执行 结果 如 下 ; 


Starting Thread-1 Exiting Main Thread Starting Thread-2 


Thread-1: Tue Aug 2 10:19:01 2016 
Thread-2: Tue Aug 2 10:19:02 2016 
Thread-1: Tue Aug 2 10:19:02 2016 
Thread-1: Tue Aug 2 10:19:03 2016 
Thread-2: Tue Aug 2 10:19:04 2016 
Thread-1: Tue Mg 2 10:19:04 2016 
Thread-1: Tue Aug 2 10:19:05 2016 
Exiting Thread-1 

Thread-2: Tue Aug 2 10:19:06 2016 
Thread-2: Tue Aug 2 10:19:08 2016 
Thread-2: Tue Aug 2 10:19:10 2016 


Exiting Thread-2 


13.3 “在线 聊天 程序 设计 的 步骤 
13.3.1 ”在 线 聊天 程序 的 服务 器 端 i 


在 服务 器 端 设计 ServerUI 类 ， 封 装 接收 消息 函数 方法 receiveMessage(self)、 发 送 消 息 
sendMessage(self)， 并 在 构造 函数 中 完成 Tkinter 界面 布局 。 

在 服务 器 端 建立 Socket 并 绑 定 5505 后 循环 接受 客户 端的 连接 请 求 。 当 服务 器 与 客户 
端的 连接 建立 后 ， 如 果 客 户 端 发 送 字符 Y， 服 务 器 端 收 到 后 会 返回 字符 Y 信息 ， 表 明 连 接 
建立 成 功 。 在 连接 建立 成 功 后 即 可 不 断 接收 客户 端 发 来 的 聊天 信息 。 

下 面 是 服务 器 端 代 码 : 

#Filename:ServerUI.py 

#Python 在 线 聊天 服务 器 端 


import tkinter 
import tkinter.font as tkFont 








import socket 

import threading 

import time,tsys 

Class SerVerUI() : 
Jocal= 27020232” 
Port=5505 


global serverSsock; 
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flag=False 
# 初 始 化 类 的 相关 属性 的 构造 函数 
def init _(self): 


self.root=tkinter.Tk() 

self.root.title('Python 在 线 聊天 -服务 器 端 V1 .0') 

# 窗 口 面 板 ， 用 4 个 frame 面板 布局 

self.frame=[tkinter.Frame (),tkinter.Frame (),tkinter.Frame (), 
tkinter.Frame ()] 

# 显 示 消 息 Text 右边 的 滚动 条 
self.chatTextScrollBar=tkinter.Scrollbar (self.frame[0]) 
self.chatTextScrollBar.pack (side=tkinter.RIGHT, fill=tkinter.Y) 
# 显 示 消息 Text， 并 绑 定 上 面 的 滚动 条 

ft=tkFont .Font (family="'Fixdsys',size=11) 
self.chatText=tkinter.Listbox(self.frame[0],width=70, height=18, 
font=ft) 
self.chatText['yscrollcommand']=self.chatTextScrollBar.set 
self.chatText .pack (expand=1, fill=tkinter .BOTH) 
self.chatTextSscrollBar['command']=self.chatText .yview () 
self.frame[0] .pack (expand=1, fill=tkinter .BOTH) 

# 标 签 ， 分 开 消息 显示 Text 和 消息 输入 Text 

label=tkinter.Label (self.frame [1] ,height=2) 

label.pack (fill=tkinter .BOTH) 

self.frame[1] .pack (expand=1, fill=tkinter .BOTH) 

# 输 入 消息 Text 的 滚动 条 

self.inputTextScrollBar=tkinter.scrollbar (self.frame[2]) 
self.inputTextScrollBar.pack (side=tkinter .RIGHT, fill=tkinter.Y) 
# 输 入 消息 Text， 并 与 滚动 条 绑 定 

ft=tkFont.Font (family="'Fixdsys',size=11) 
self.inputText=tkinter.Text (self.frame[2] ,width=70, height=8, font=ft) 
self.inputText['yscrollcommand']=self.inputTextScrollBar.set 
self.inputText .pack (expand=1, fill=tkinter .BOTH) 
self.inputTextScrollBar['command']=self.chatText .yview() 
self.frame [2] .pack (expand=1, fill=tkinter .BOTH) 

#“ 发 送 ” 按 钮 

self .sendButton=tkinter.Button (self.frame[3], text=' 发 送 ', width=10, 
command=self.sendMessage) 

self.sendButton.pack (expand=]1, side=tkinter.BOTTOM and tkinter 
.RIGHT, padx=25, pady=5) 

#“ 关 闭 ” 按 钮 

self.closeButton=tkinter.Button (self.frame[3], text=' 关 闭 ', width=10, command 
=self.close) 
self.closeButton.pack (expand=1, side=tkinter.RIGHT,padx=25,pady=5) 
self.frame[3] .pack (expand=1, fill=tkinter .BOTH) 
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# 接 收 消息 


def receiveMessage (self): 


# 建 立 Socket 连接 
Self.serverSock=socket .socket (socket .AF INET, Socket.SOCK STREAM) 
self.serverSock.bind((self.local, self .port)) 
self.serverSsock.listen (15) 
self.buffer=1024 
self.chatText.insert (tkinter.END, ' 服 务 器 已 经 就 绪 ...... ') 
# 循 环 接受 客户 端的 连接 请 求 
while True: 
self.connection, self.address=self.serverSock.accept () 
self.flag=True 
while True: 
# 接 收 客户 端 发 送 的 消息 
self.cientMsg=self .connection.recv (self.buffer) .decode ('utf-8') 
if not self.cientMsg: 
continue 
elif self.cientMsg=="'Y"': 


self.chatText.insert (tkinter.END, ' 服务器 端 已 经 与 客户 端 建立 


self.connection.send(b'Y') 
elif self.cientMsg=='N': 
self.chatText.insert (tkinter.END, ' 服务 器 端 与 客户 端 建立 连接 


self.connection.send(b'N') 
ESes 
theTime=time.strftime ("%Y-%m-%d %H:%M:S%S"，time.localtime ()) 


self.chatText.insert (tkinter.END，' 客 户 端 ' + theTime +' 说 : \n') 
self.chatText.insert (tkinter.END, ' ' + self.cientMsg) 


# 发 送 消息 
def sendMessage (self): 


# 得 到 用 户 在 Text 中 输入 的 消息 

message=self.inputText .get ('1.0',tkinter .END) 

# 格 式 化 当前 的 时 间 

theTime=time.strftime ("%Y-%m-%d %H:SM:%S", time.localtime()) 
self.chatText.insert (tkinter.END, "服务 器 '+theTime+' 说 : \n') 
self.chatText.insert (tkinter.END,' '+message+'\n') 


if self.flag==True: 
# 将 消息 发 送 到 客户 端 
self.connection.-send(message-encode () ) 
1302 
#Socket 连接 没有 建立 ， 提 示 用 户 
self.chatText .insert (tkinter.END,' 您 还 未 与 客户 端 建立 连接 , 客户 端 无 法 
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收 到 您 的 消息 \n') 
# 清 空 用 户 在 Text 中 输入 的 消息 
self.inputText.delete(0.0,message. len _()-1.0) 
# 关 闭 消息 窗口 并 退出 
def close(self): 
sys.exit () 
# 启 动 线程 接收 客户 端的 消息 
def startNewThread (self): 
# 启 动 一 个 新 线程 来 接收 客户 端的 消息 
#args 是 传递 给 线程 函数 的 参数 ，receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=self .receiveMessage,args=()) 
thread.setDaemon (True); 
thread.start (); 
def main(): 
server=ServerUI () 
SerVer. startNewThread () 
serVer .root .mainloop () 
if _ name =='_ _ main _': 


main() 


13.3.2 ”在 线 聊 天 程序 的 客户 端 


在 客户 端 设 计 ClientUI 类 ， 封 装 接收 消息 函数 方法 receiveMessage(self)、 发 送 消息 
sendMessage(selfj)， 并 在 构造 函数 中 完成 Tkinter 界面 布局 。 

在 客户 端 建立 Socket 后 ， 向 服务 器 发 送 字 符 Y， 表示 客户 端 要 连接 服务 器 。 服 务 器 端 
收 到 后 会 返回 字符 YY 信息， 表明 连接 建立 成 功 。 在 连接 建立 成 功 后 即 可 不 断 接 收服 务 器 发 
来 的 聊天 信息 。 

下 面 是 客户 端 代码 : 

#Filename:ClientUI.py 

#Python 在 线 聊 天 客户 端 2016-2-12 


import tkinter 

import tkinter.font as tkFont 

import socket 

import threading 

import time,tsys 

class ClientUI() : 
Oocal=-4 227 由 了 
port=5505 
global clientSsock; 
flag=False 
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# 初 始 化 类 的 相关 属性 的 构造 函数 

def init _ (self) : 
self.root=tkinter.Tk() 
self.root.title('Python 在 线 聊天 -客户 端 V1 .0') 
# 窗 口 面板 ， 用 4 个 面板 布局 
self.frame=[tkinter.Frame (),tkinter.Frame (),tkinter.Frame (), 
tkinter.Frame ()] 
# 以 下 界面 设计 与 服务 器 端 相同 
# 显 示 消 息 Text 右边 的 滚动 条 
self.chatTextScrollBar=tkinter.Scrollbar (self.frame[0]) 
self.chatTextScrollBar.pack (side=tkinter.RIGHT, fill=tkinter.Y) 
# 显 示 消息 Text， 并 绑 定 上 面 的 滚动 条 
ft=tkFont .Font (family="'Fixdsys',size=11) 
self.chatText=tkinter.Listbox (self.frame[0] ,width=70, height=18, font=ft) 
self.chatText['yscrollcommand']=self.chatTextScrollBar.set 
self.chatText .pack (expand=1, fill=tkinter .BOTH) 
self.chatTextScrol1Bar['command']=self.chatText.yview() 
self.frame[0] .pack(expand=1,fil1=tkinter.BOTH) 
# 标 签 ， 分 开 消息 显示 Text 和 消息 输入 Text 
label=tkinter.Label (self.frame [1] ,height=2) 
label.pack (fill=tkinter .BOTH) 
self.frame[1] .pack (expand=1, fill=tkinter .BOTH) 
# 输 入 消息 Text 的 滚动 条 
self.inputTextScrol1Bar=tkinter.Scrollbar (self.frame[2]) 
self.inputTextScrol1Bar.pack(side=tkinter.RIGHT,fil1=tkinter.Y) 
# 输 入 消息 Text， 并 与 滚动 条 绑 定 
ft=tkFont.Font (family="'Fixdsys',size=11) 
self.inputText=tkinter.Text (self.frame [2] ,width=70, height=8, font=ft) 
self.inputText['yscrollcommand']=self.inputTextScrollBar.set 
self.inputText .pack (expand=1, fill=tkinter .BOTH) 
self.inputTextScrollBar['command']=self.chatText .yview() 
self.frame[2] .pack (expand=1, fill=tkinter .BOTH) 
#“ 发 送 ” 按 钮 
self.sendButton=tkinter.Button (self.frame[3],text=' 发 送 '， 
width=10,command=self .sendMessage) 
self.sendButton.pack (expand=1, side=tkinter.BOTTOM and tkinter 
.RIGHT, padx=15, pady=8) 
#“ 关 闭 ” 按 钮 
self.closeButton=tkinter .Button (self .frame[3], text=' 关 闭 ' , width=10, 
command=self.close) 
self.closeButton.pack (expand=1, side=tkinter.RIGHT,padx=15,pady=8) 
self.frame[3] .pack (expand=1, fill=tkinter .BOTH) 
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# 接 收 消息 
def receiveMessage (self): 
EEys 
# 建 立 Socket 连接 
self.clientSock=socket .socket (socket .AF INET, socket .SOCK STREAM) 
self.clientSock.connect ((self.local, self.port)) 
self.flag=True 
except: 
self.flag=False 


self .chatText .insert (tkinter .END, ' 您 还 未 与 服务 器 端 建立 连接 , 请 检查 服 
务 器 是 否 启动 ') 
return 

self.buffer=1024 

self.clientSock.send('Y' .encode () ) # 向 服务 器 发 送 字符 Y， 表 示 客 户 端 要 连接 服务 器 


while True: 
EE 

if self.flag==True: 
# 连 接 建立 ， 接 收服 务 器 端 消 息 
self.serverMsg=self.clientSock.recv (self.buffer) 
.decode ('utf-8') 
if self.serverMsg=="'Y": 

self.chatText.insert (tkinter.END, ' 客户 端 已 经 与 服务 器 端 


elif self.serverMsg=='N": 
self.chatText.insert (tkinter.END, ' 客户 端 与 服务 器 端 建立 


elif not self.serverMsg: 
continue 

esEses 
theTime=time.strftime ("%Y-%m-%d S$H:SM:S%SS"， 七 Ime 
.localtime ()) 


self.chatText .insert (tkinter.END, ' 服 务 器 端 ' + theTime 


+， 说 : \n') 
self.chatText .insert (tkinter.END, ' ' + self.serverMsg) 
else: 
break 


except EOFError as msg: 
raise msg 
self.clientSock-close() 
break 
# 发 送 消息 
def sendMessage (self): 
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# 得 到 用 户 在 Text 中 输入 的 消息 


message=self.inputText.get ("1.0',tkinter .END) 

坦 格式 化 当前 的 时 间 

theTime=time .strftime ("%Y-Sm-gsd %H:%M:$%$S", time.localtime()) 
self.chatText.insert (tkinter.END,，' 客 户 端 器 ' + theTime +' 说 : \n') 


self.chatText.insert (tkinter.END,' ' + message + '\n') 
if self.flag==True: 

self.clientSock.send (message.encode ()); # 将 消息 发 送 到 服务 器 端 
LS 


#Socket 连接 没有 建立 ， 提 示 用 户 
self.chatText.insert (tkinter .END, ' 您 还 未 与 服务 器 端 建立 连接 , 服务 器 端 
无 法 收 到 您 的 消息 \n') 
# 清 空 用 户 在 Text 中 输入 的 消息 
self.inputText.delete(0.0,message._ _len _()-1.0) 
# 关 闭 消息 窗口 并 退出 
def close(self) : 
sys.exit () 
# 启 动 线程 接收 服务 器 端的 消息 
def startNewThread (self) : 
# 启 动 一 个 新 线程 来 接收 服务 器 端的 消息 
#args 是 传递 给 线程 函数 的 参数 ，receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=self.receiveMessage,args=()) 
thread.setDaemon (True); 
thread.start (); 


def main(): 


1£ 


| 262 


client=ClientUI() 
client.startNewThread () # 启 动 线程 接收 服务 器 端的 消息 


client.root.mainloop () 


__name =='_ main _': 


main() 





网 络 通 信和 案例 一 一 基于 
UDP 的 网 络 五 子 棋 游 戏 


14.1 网 络 五 子 棋 游 戏 简介 


五子棋 是 一 种 家 喻 户 晓 的 棋 类 游戏 , 它 的 多 变 吸 引 了 无 数 玩家 。 本 章 设计 的 五 子 棋 游 戏 
是 一 简易 五 子 棋 ， 棋 盘 为 15x15， 黑 子 先 落 。 在 每 次 下 棋子 前 先 判断 该 处 有 无 棋子 ， 有 则 不 
能 沙子 ， 超 出 边界 不 能 沙子 。 任 何 一 方 有 达到 横向 、 竖 向 、 斜 向 、 反 斜 向 连 到 5 个 棋子 则 胜 
利 





本 章 介绍 基 的 Socket 编程 方法 来 制作 网 络 五 子 棋 游戏 程序 。 网 络 五 子 棋 游戏 
采用 C/S 架构 ， 分 为 服务 器 端 和 客户 端 。 服 务 器 端 运行 界面 如 图 14-1 所 示 ， 在 游戏 时 服务 
器 端 首 先 启 动 ， 客 上 aol i 服务 器 端 可 以 走 棋 














图 14-1 网 络 五 子 棋 游 戏 的 服务 器 端 界面 
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户 根据 提示 信息 ， 轮 到 自己 下 棋 才 可 以 在 棋盘 上 落 子 ， 同 时 下 方 标签 会 显示 对 方 的 
走 棋 信息 ， 服 务 器 端 用 户 通 过 “退出 游戏 ”按钮 结束 游戏 。 














客户 端 运行 界 [ 














如 图 14-2 所 示 ， 需 要 输入 服务 器 的 瑟 地 址 〈 这 里 采用 默认 地 址 ， 即 



































本 机 地 址 ) 如 果 正 确 且 服务 器 启动 则 可 以 连接 服务 器 。 连接 成 功 后 客户 端 用 户 根据 提示 信 
息 ， 轮 到 自己 下 棋 才 可 以 在 棋盘 上 落 子 ， 同 样 可 以 通过 “退出 游戏 ”按钮 结束 游戏 。 














ee 





吉 广 渍 二 的 位 置 7.7 
| 














图 14-2 网 络 五 子 棋 游 戏 的 客户 端 界面 





14.2 ”五子 棋 游 戏 的 设计 思想 


在 下 棋 过 程 中 ， 


为 了 保存 所 下 过 棋子 的 信息 ， 使 用 列表 map。map[x][y] 存 储 棋盘 (x,y) 


处 棋子 的 信息 ， 如 果 为 0 代表 黑子 ， 为 1 代表 白 子 。 























个 由 














游戏 运行 时 ， 在 鼠标 单 击 事件 中 判断 单 击 位 置 是 否 合法 ， 即 不 能 在 已 有 棋子 的 位 置 单 
ff， 也 不 能 超出 游戏 棋盘 边界 ， 如 果 合法 ， 则 将 此 位 置信 息 加 入 到 map 列表 和 back 列表 
于 悔 棋 )， 同 时 调用 checkWin(x,y) 判 断 游戏 的 输赢 。 

















本 游戏 的 设计 关键 是 判断 输赢 的 算法 。 对 于 该 算法 的 具体 实现 ， 大 致 分 为 以 下 几 个 


部 分 : 


(1) 判断 X=Y 轴 上 是 否 形成 五 子 连 珠 。 
(2) 判断 X=-Y 轴 上 是 否 形成 五 子 连珠 。 


(3) 判断 了 轴 ] 
(4) 判断 入 轴 ] 
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上 是 否 形成 五 子 连珠 。 
上 是 否 形成 五 子 连珠 。 
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以 上 4 种 情况 只 要 任何 一 种 成 立 ， 那 么 就 可 以 判断 输赢 。 
def win lose() : # 输 赢 判 断 


# 扫 描 整 个 棋盘 ， 判 断 是 否 连 成 5 颗 
a=str (turn) 


print ("a=",a) 


for i in range(0,11): #0~10 
# 判 断 X=Y 轴 上 是 否 形成 五 子 连珠 
for j in range(0,11): #0~10 


if map[i][j]==a and map[i+1] [j+1]==a and map[i+2] [j+2]==a and 
map[i+3] [j+3]==a and map[i+4] [j+4]==a:print ("Xx=Y 轴 上 形成 五 子 连珠 ") 
return True 


for i in range(4,15): #4~14 
# 判 断 x=-Y 轴 上 是 否 形成 五 子 连珠 
for j in range(0,11): #0~10 


if map[i][j]==a and map[i-1] [j+1]==a and map[i-2] [j+2]==a and 
map[i-3] [j+3]==a and map[i-4] [j+4]==a:print ("X=-Y 轴 上 形成 五 子 连珠 ") 
return True 


for i in range(0,15): #0 一 14 
# 判 断 Y 轴 上 是 否 形成 五 子 连 珠 
for j in range(4,15): #4 一 14 


if map[i][j]==a and map[i][j-1]==a and map[i][j-2]==a and 
map[i] [j-3]==a and map[i] [j-4]==a:print("Y 轴 上 形成 五 子 连珠 ") 
return True 


for i in range(0,11): #0~10 
# 判 断 X 轴 上 是 否 形成 五 子 连珠 
for j in range(0,15) : #0~14 


if map[i][j]==a and map[i+1] [j]==a and map[i+2] [j]==a 
and map[i+3] [j]==a and map[i+4] [j]==a:print ("x 轴 上 形成 五 子 连珠 ") 
return True 


return False 


判断 输赢 实际 上 不 用 扫描 整个 棋盘 ， 如 果 能 得 到 刚 下 的 棋子 的 位 置 (x, y)， 就 不 用 扫描 
整个 棋盘 ， 而 仅仅 在 此 棋子 附近 的 横 、 竖 、 斜 方向 均 判 断 一 遍 即 可 。 

checkWin(x,y) 判 断 这 个 棋子 是 否 和 其 他 棋子 连 成 五 子 ， 即 判断 输赢 。 它 是 以 (x,y) 为 中 
心 通过 横向 、 纵 向 、 斜 方向 的 判断 来 统计 相同 颜色 的 棋子 个 数 。 

例如 以 水 平方 向 (横向 ) 的 判断 为 例 ， 以 (x, y) 为 中 心计 算 水 平方 向 上 的 棋子 数量 时 首 
先 向 右 最 多 4 个 位 置 ， 如 果 同 色 则 count 加 1， 然 后 向 左 最 多 4 个 位 置 ， 如 果 同 色 则 count 
加 1。 统 计 完成 后 如 果 count >=5， 则 说 明 水 平方 向 连 成 五 子 。 其 他 方向 同 理 。 因 为 每 个 方 
向 判断 前 下 子 处 (x,y) 还 有 己方 一 个 ， 所 以 count 的 初始 值 为 1。 


def checkWin (x,y): 
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flag=False 

count=1 ， 意 保 存 共有 相同 颜色 的 多 少 棋子 相连 

Color=map [X] [Y] 

# 通 过 循环 来 做 棋子 相连 的 判断 

# 横 向 的 判断 

# 判 断 横向 是 否 有 5 个 棋子 相连 ， 特 点 是 纵 坐标 相同 ， 即 map [x] [Y] 中 的 Y 值 是 相同 


i=1 


while color==map[x+i] [y] : # 向 右 统 计 
count=count+1 
i=i+l 

i=1 

while color==map[x-i] [y] : # 向 左 统计 


count=count+1 
i=i+l 

if count>=5: 
flag=True 

# 纵 向 的 判断 

i2=1 

Count2=1 

while color==map[x] [y+i2]: 
count2=count2+1 
i2=i2+1 

i2=1 

while color==map [x] [y-i2]: 
count2=count2+1 
i2=i2+1 

if count2>=5: 
flag=True 

# 斜 方向 的 判断 〈 右 上 + 左下 ) 

i3=1 

count3=1 

while color==map [x+i3] [y-i3]: 
count3=count3+1 
i3=i3+1 

i3=1 

while color==map [x-i3] [y+i3]: 
count3=count3+1 
i3=i3+1 

if count3>=5: 
flag=True 

# 斜 方向 的 判断 〈 右 下 + 左上 ) 


i4=1 
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count4=1 

while color==map [x+i4] [y+i4]: 
count4=count4+1 
i4=i4+1 

i4=1 

while color==map[x-i4] [y-i4]: 
count4=count4+1 
i4=i4+1 

if count4>=5: 
flag=True 

return flag 


在 本 程序 中 每 下 一 步 棋 子 ， 调 用 checkWin(x,y) 函数 判断 是 否 已 经 连 成 五 子 ， 如 果 返 
回 Tme， 则 说 明 已 经 连 成 五 子 ， 显 示 输赢 结果 对 话 框 。 


14.3 ”关键 技术 














14.3.1 UDP 编程 





视频 讲解 


对 于 TCP，UDP 则 是 面向 无 连接 的 协议 。 
在 使 用 UDP 协议 时 不 需要 建立 连接 ， 只 需要 知道 对 方 的 了 P 地 址 和 端口 号 就 可 以 直接 
发 数据 包 ， 但 是 能 不 能 到 达 就 不 知道 了 。 虽 然 用 UDP 传输 数据 不 可 靠 ， 但 它 的 优点 是 和 
TCP 相 比 速度 快 ， 对 于 不 要 求 可 靠 到 达 的 数据 可 以 使 用 UDP 协议 。 
通过 UDP 协议 传输 数据 和 TCP 类 似 , 使 用 UDP 的 通信 双方 也 分 为 客户 端 和 服务 器 端 。 
图 14-3 所 示 为 无 连接 UDP 的 时 序 图 。 












































服务 器 客户 机 
Socket() Socket() 
Bind(O) 
- 服务 请 求 | 
ReceiveFrom()| SendTo() 
服务 应 答 1 
SendTo() ReceiveFrom()| 
Close() Close() 











图 14-3 无 连接 UDP 的 时 序 图 
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对 于 UDP C/S， 客 户 机 并 不 与 服务 器 建立 一 个 连接 ， 而 仅仅 调用 函数 SendTo0 给 服务 
器 发 送 数 据 报 。 类似 地 , 服务 器 也 不 从 客户 端 接收 一 个 连接 , 只 是 调用 函数 ReceiveFrom()， 
等 待 从 客户 端 来 的 数据 。 通 常 ， 依 照 ReceiveFrom() 得 到 的 协议 地 址 以 及 数据 报 ， 服 务 器 就 
可 以 给 客户 送 一 个 应 答 。 

贺 14-1 编写 一 个 简单 的 UDP 演示 下 棋 程 序 。 服 务 器 端 把 UDP 客户 端 发 来 的 下 棋 
坐标 信息 (x.y) 显 示 出 来 ， 并 把 坐标 加 1 后 (模拟 服务 器 端 下 棋 ) 再 发 给 UDP 客户 端 。 

服务 器 首先 需要 绑 定 8888 端口 : 








import socket ## 导 入 socket 模块 
S=Socket . socket (Socket .AF INET, socket.SOCK DGRAM) 
s.bind(('127.0.0.1', 8888)) # 绑 定 端口 


在 创建 Socket 时 , SOCK_DGRAM 指定 了 这 个 Socket 的 类 型 是 UDP。 绑 定 端口 和 TCP 
一 样 ， 但 是 不 需要 调用 listen() 方 法 ， 而 是 直接 接收 来 自任 何 客户 端的 数据 : 


print('Bind UDP on 8888...') 
while True: 
# 接 收 数据 
data, addr=s.recvfrom(1024) 
print('Received from %s:%s.' % addr) 
print('received:',data) 
p=data.decode ('utf-8') .split (","); #decode() 解 码 ， 将 字 节 串 转 换 成 字符 串 
zx=int (p[0]); 
y=int (p[1]); 
print (p[0] ,Pp[1]) 
pos=str (x+1)+", "+str (y+1) # 模 拟 服务 器 端 下 棋 的 位 置 
s.sendto (pos.encode ('utf-8'),addr) # 发 回 客户 端 


recvfrom() 方 法 返回 数据 和 客户 端的 地 址 与 端口 ， 这 样 服务 器 收 到 数据 后 直接 调用 
sendto() 就 可 以 把 数据 用 UDP 发 给 客户 端 。 

在 客户 端 使 用 UDP 时 ， 首 先 创建 基于 UDP 的 Socket， 然 后 不 需要 调用 connect)， 直 
接 通过 sendto0) 给 服务 器 发 数据 : 


import socket # 导 入 socket 模块 

Ss=socket . socket (socket.AF INET， socket .SOCK DGRAM) 

x=input ("请 输入 x 坐标 ") 

y=input ("请 输入 y 坐标 ") 

data=str (x)+","+str (y) 

s.sendto(data.encode ('utf-8'), ('127.0.0.1', 8888)) 
#encode () 编码 ， 将 字符 串 转换 成 传送 的 字 节 串 

# 接 收服 务 器 加 1 后 的 坐标 数据 

data?2, addr=s.recvfrom(1024) 

print ("接收 服务 器 加 1 后 坐标 数据 : "，data2.decode ('utf-8')) 
#decode () 解码 

s.close() 
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从 服务 器 接收 数据 仍然 调用 recvfrom() 方 法 。 
这 里 仍然 用 两 个 命令 行 分 别 启动 服务 器 和 客户 端 测 试 ， 运 行 效果 如 图 14-4 和 图 14-5 
所 示 。 











MP CAWindows\py.exe 关头 


-8.0.1:62893. 











= 一 4 





图 14-4 服务 器 程序 效果 

















图 14-5 客户 端 程序 效果 





上 面 模拟 了 服务 器 端 和 客户 端 两 方 下 棋 时 的 通信 过 程 ， 有 此 基础 可 以 实现 基于 UDP 
的 网 络 五 子 棋 游戏 ， 真 正 开 发 出 实用 的 网 络 程序 。 


14.3.2” 自 定义 网 络 五 子 棋 游 戏 的 通信 协议 


网 络 五 子 棋 游 戏 的 设计 难点 在 于 需要 与 对 方 通信 , 这 里 使 用 了 面向 非 连接 的 Socket 编 
晤 。 Socket 编程 用 于 于 2 
并 连接 ， 然 后 发 送 和 接收 数据 ， 交 互 完成 后 需要 断 开 连 接 。 本 章 的 通信 采用 基于 UDP 的 





Socket 编程 实现 。 虽然 这 里 两 台 计 算 机 不 分 主 次 , 但 在 设计 时 假设 一 台 做 服务 器 端 ( 黑 方 )， 











等 待 其 他 人 加 入 。 当 其 他 人 想 加 入 的 时 候 输入 服务 器 端 主机 的 他。 为 了 区 分 通信 中 传送 的 
是 “输赢 信息 ”“ 下 的 棋子 位 置信 息 ”“ 结 束 游戏 ”等 ， 在 发 送信 息 的 首部 加 上 标识 。 因 此 
定义 了 如 下 协议 : 

@ movel 下 的 棋子 位 置 坐 标 (x,y) 

例如 ,“movel7.4” 表 示 对 方 下 子 位 置 坐标 (7.4)。 

@ overl 哪 方 赢 的 信息 


例如 ,“over| 黑 方 你 赢 了 ”表示 黑 方 赢 了 。 
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| 站 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 


©@ exitl 

表示 对 方 离开 了 ， 游 戏 结束 。 
@ joinl 

其 表示 连接 服务 器 。 


当然 ， 可 以 根据 程序 功能 增加 协议 ， 例 如 悔 棋 、 文 字 聊 天 等 协议 。 由 于 本 程序 没有 设 
计 “ 悔 棋 ” 和 “文字 聊天 ”功能 ， 所 以 没 定义 相应 的 协议 ， 读 者 可 以 自己 完善 程序 。 

在 程序 中 根据 接收 的 信息 (当然 都 是 字符 串 ) 通 过 字符 串 .split("|") 获 取消 息 类 型 (move、 
join、exit 或 者 over)， 从 中 区 分 出 “输赢 信息 over”“ 下 的 棋子 位 置信 息 move” 等 ， 代 码 
如 下 : 

def receiveMessage(): # 接 收 消息 函数 

global s 








while True: 
# 接 收 客户 端 发 送 的 消息 
global addr 
data, addr=s.recvfrom(1024) 
data=data.decode ('utf-8') 
a=data.split ("|") 考分 割 数据 
if not data: 
print('client has exited!') 
break 
alit al0]== olin # 连 接 服务 器 请 求 
print ('client 连接 服务 器 !') 
labell["text"]='client 连接 服务 器 成 功 ， 请 你 走 棋 ! ，' 
elif a[0]=="'exit': # 对 方 退 出 信息 
print ('client 对 方 退 出 !') 
labell["text"]='client 对 方 退出 ， 游 戏 结束 !' 
elif a[0]=='over': ## 对 方 赢 信息 
print ( "对方 赢 信息 !) 
labell["text"]=data.split ("|") [0] 
showinfo (title=" 提 示 ",message=data.split ("1") [1]) 
elif a[0]=='move' : # 客 户 端 走 的 位 置信 息 ， 例 如 "move17, 4" 
print('received:',data, 'from',addr) 
p=a[1] .split(",") 
x=int (p[0]); 
y=int (p[1]); 


print (p[0],p[1]) 

labell["tezxt"]=" 客 户 端 走 的 位 置 "+p[0]+p[1] 

drawotherChess (x, y) # 画 对 方 棋子 
s.close() 


掌握 通信 协议 以 及 单机 版 五 子 棋 游戏 的 知识 之 后 就 可 以 开发 网 络 五 子 棋 游戏 了 。 
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14.4 网 络 五 子 棋 游 戏 程序 设计 的 步骤 


14.4.1 ”服务 器 端 程序 设计 的 步 又 mi 


@ 主 程序 

定义 含 两 个 棋子 图 片 的 列表 imgs, 创建 Window 窗口 对 象 root, 初始 化 游戏 地 图 map， 
绘制 15x15 的 游戏 棋盘 ， 添 加 显示 提示 信息 的 标签 Label， 绑 定 Canvas 的 鼠标 和 按钮 左 键 
单 击 事件 。 

同时 创建 UDP 通信 服务 器 端的 SOCKET， 绑 定 在 8000 端口 ， 启 动 线程 接收 客户 端的 
消息 ， 最 后 的 rootmainloop() 方 法 是 进入 窗口 的 主 循环 ， 也 就 是 显示 窗口 。 


from tkinter import * 














from tkinter.messagebox import * 
import socket 

import threading 

import os 


root=TKk () 

root .title ("网 络 五 子 棋 V2 . 0 一 服务 器 端 ") 

# 五 子 棋 一 一 夏 敏 捷 2016-2-11 

imgs=[PhotoImage (file='D:\\python\\bmp\\Blackstone.gif'), 
PhotoImage (file='D: \\python\\bmp\\Whitestone.gif')] 


turn=0 # 轮 到 哪 方 走 棋 ，0 是 黑 方 ，1 是 白 方 
Myturn=-1 # 保 存 自己 的 角色 ，-1 表示 还 没 确定 下 来 
map=[[" Mm mm ntory 


in range(15)] 
cv=Canvas (root, bg='green', width=610, height=610) 


drawQiPan () # 绘 制 15x15 的 游戏 棋盘 
cv.bind("<Button-1>", callpos) 

cv.pack() 

label1=Label (root, text=" 服 务 器 端 . . .") # 显 示 提 示 信 息 
label1.pack() 

button1=Button (root,text=" 退 出 游戏 ") 按钮 


buttonl .bind("<Button-1>", callexit) 

buttonl .pack () 

# 创 建 UDP SOCKET 

Ss=socket .socket (socket .AF INET,socket.SOCK DGRAM) 
s.bind(('localhost',8000)) 

addr=('"'localhost",8000) 

startNewThread () # 启 动 线程 接收 客户 端的 消息 
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| 这 概 项 目 案例 开发 
从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 
receiveMessage (); 


root .mainloop() 


@ 退出 函数 
“退出 游戏 ”按钮 单 击 事件 的 代码 很 简单 ， 仅 仅 发 送 一 个 "exit" 命 令 协 议 消息 ， 最 后 调 
os. exit(0) 结 束 程序 。 
def callexit (event): # 退 出 
pos="exit|" 




















sendMessage (pos) 
os. exit (0) 
人 @ 走 棋 函数 
在 鼠标 单 击 事件 中 完成 走 棋 功 能 ， 判 断 单 击 位 置 是 否 合法 ， 既 不 能 在 已 有 棋 的 位 置 单 
击 ， 也 不 能 超出 游戏 棋盘 边界 ， 如 果 合法 ， 则 将 此 位 置信 息 记 录 到 map 列表 (数组 ) 中 。 
同时 由 于 是 网 络 对 战 ， 第 一 次 走 棋 时 还 要 确定 自己 的 角色 (是 白 方 还 是 黑 方 )， 而 且 
要 判断 是 否 轮 到 自己 走 棋 。 这 里 使 用 两 个 变量 Mytum、tum 来 解决 。 
Myturn=-1 # 保 存 自 己 的 角色 
Mytum 是 -1 表示 还 没 确定 下 来 ， 在 第 一 次 走 棋 时 修改 。 
turm 保存 轮 到 谁 走 棋 ， 如 果 tum 是 0 表示 轮 到 黑 方 ，tum 是 1 表示 轮 到 白 方 。 
最 后 是 本 游戏 的 关键 一 一 输赢 判断 。 在 程序 中 调用 win_lose0 函 数 判断 输赢 ， 判 断 在 4 
种 情况 下 是 否 连 成 五 子 ， 返回 True 或 False。 根 据 当 前 走 棋 方 tum 的 值 (0 为 黑 方 ，1 为 白 
方 ) 得 出 谁 赢 。 
自己 走 完 后 轮 到 对 方 走 棋 。 
def callpos (event) : # 走 棋 
global turn 





global Myturn 
if Myturn==-1: # 第 一 次 确定 自己 的 角色 (是 白 方 还 是 黑 方 》 
Myturn=turn 
else 
if (Myturn!=turn): 
showinfo (title=" 提 示 ",message=" 还 没 轮 到 自己 走 棋 ") 
return 
#print ("clicked at", event.x, event.y, turn) 
x= (event.x)//40 # 换 算 棋盘 坐标 
y= (event.y)//40 
printl elicked at x, Yr turny 
if map[x] [y] !=" "™: 
showinfo (title=" 提 示 ",message=" 已 有 棋子 ") 
SLSes 
imgl=imgs [turn] 
cv.create image((x*40+20,y*40+20),image=img1l) ”# 画 自己 的 棋子 
cv.pack() 
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map [X] [Y]=str (上 turn) 
pos=str (x}+", "+str (y) 
sendMessage ("move|"+pos) 
print ("服务 器 走 的 位 置 ", pos) 
labell["text"]=" 服 务 器 走 的 位 置 "+pos 
# 输 出 输赢 信息 
if win lose()==True: 
if turn==0: 
showinfo (title=" 提 示 ",message=" 黑 方 你 赢 了 ") 
sendMessage ("over| 黑 方 你 赢 了 ") 
elser: 
showinfo (title=" 提 示 ", message=" 白 方 你 赢 了 ") 
sendMessage ("over | 白 方 你 赢 了 ") 
# 换 下 一 方 走 棋 


if turn==0: 





tyrn=1 
= 


turn=0 


@ 面 对 方 棋子 
当 轮 到 对 方 走 棋 子 后 ， 在 自己 的 棋盘 上 根据 tum 知道 对 方 角 色 ， 从 socket 获取 对 方 走 
棋 坐 标 (x,y)， 从 而 画 出 对 方 棋子 。 在 画 出 对 方 棋子 后 ， 同 样 换 下 一 方 走 棋 。 


def drawotherChess (x,y): # 画 对 方 棋子 


global turn 
imgl=imgs [turn] 
cv.create image ((x*40+20,y*40+20),image=img1) 
cv.pack() 
map[x] [y]=str (turn) 
# 换 下 一 方 走 棋 
if turn==0: 
turn=1 
elseR 


turn=0 


全 面 棋盘 
drawQiPan0) 画 15x15 的 五 子 棋 棋 盘 。 


def drawQiPan(): # 画 棋盘 
for i in range(0,15) : 


cv.create line(20,20+40*i,580,20+40*i,width=2) 


for i in range(0,15): 


cv.create line(20+40*i,20,20+40*i,580,width=2) 


cv.pack() 
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on 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


@ 输赢 判断 
win_lose() 从 4 个 方向 扫描 整个 棋盘 ， 判 断 是 否 连 成 5 子 。 
# 输 赢 判断 


def win lose() : 


# 扫 描 整 个 棋盘 ， 判 断 是 否 连 成 5 子 
a=str (turn) 

print ("a=",a) 

for i in range(0,11): 


# 判 断 X=Y 轴 上 是 否 形成 五 子 连 珠 


for j in range(0,11) : #0~10 
if map[i][j]==a and map[i+1] [j+1]==a and map[i+2] [j+2]==a and 


map [i+3] [j+3]==a and map[i+4] [j+4]==a:print ("x=Y 轴 上 形成 五 子 连 珠 ") 


#0~10 


return True 
for 1 in range(dr15): #4~14 


# 判 断 x=-Y 轴 上 是 否 形成 五 子 连 珠 
for j in range(0,11): #0~10 
if map[i][j]==a and map[i-1] [j+1]==a and map[i-2] [j+2]==a and 
map [i-3] [j+3]==a and map[i-4] [j+4]==a:print ("x=-Y 轴 上 形成 五 子 连珠 ") 


return True 
for i in range(0,15): #0~14 


# 判 断 Y 轴 上 是 否 形成 五 子 连珠 


for j in range(4,15): #4~14 
if map[i][j]==a and map[i][j-1]==a and map[i][j-2]==a and 
map[i] [j-3]==a and map[i] [j-4]==a:print ("Y 轴 上 形成 五 子 连珠 ") 


return True 
for i in range(0,11): #0~10 


# 判 断 X 轴 上 是 否 形成 五 子 连珠 
for j in range(0,15) : #0~14 


if map[i][j]==a and map[i+1] [j]==a and map[i+2] [j]==a and 
map[i+3] [j]==a and map[i+4] [j]==a:print ("x 轴 上 形成 五 子 连珠 ") 
return True 
return False 


@ 输出 map 地 图 
这 里 主要 是 显示 当前 棋子 信息 。 


def print map() : # 输 出 map 地 图 
for j in range(0,15) : #0~14 
#0 一 14 


for i in range(0,15) : 
print (map[i][j],end=" ') 


print ('w') 


@ 接收 消息 
本 程序 的 关键 部 分 就 是 接收 消息 data， 从 data 字符 串 .split("") 中 分 割 出 消息 类 型 
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(move、join、exit 或 者 over)。 如 果 为 join'， 是 客户 端 连接 服务 器 请 求 ; 如 果 为 'exit， 是 对 
方 客户 端 退出 信息 ;如 果 为 ' move '， 是 客户 端 走 的 位 置信 息 ; 如果 为 ' over '， 是 对 方 客户 
端 赢 的 信息 。 这 里 重点 处 理 对 方 的 走 棋 信息 ， 例 如 “movel7,4”， 通 过 字符 串 .split(",") 分 割 
出 (x,y) 坐 标 。 














def receiveMessage(): 
global s 
while True: 

# 接 收 客户 端 发 送 的 消息 

global addr 

data, addr=s.recvfrom(1024) 

data=data.decode ('utf-8') 

a=data.split ("|") # 分 割 数据 

if not data: 
print('client has exited!') 
break 

oii alol== on # 连 接 服务 器 请 求 
print ('client 连接 服务 器 !') 
labell["text"]='client 连接 服务 器 成 功 ， 请 你 走 棋 ! " 

GTi all0l Ex # 对 方 退出 信息 
Print ('client 对 方 退 出 !') 
labell["text"]='client 对 方 退出 ， 游 戏 结束 ! ' 

elif a[0]=='over': 间 对 方 赢 信息 
print ( "对方 赢 信息 !) 
labell["text"]=data.split ("|") [0] 
showinfo (title=" 提 示 ",message=data.split ("1") [1]) 

elif a[0]=='move': # 客 户 端 走 的 位 置信 息 "move17,4" 
print('received:',data, 'from',addr) 
p=a[1] .split(",") 
x=int (p[0]); 
y=int (p[1]); 
print (p[0] ,Pp[1]) 
labell["text"]=" 客 户 端 走 的 位 置 "+p[0]+p[1] 
drawotherChess (x, y) # 画 对 方 棋子 


s.close() 
发 送 消息 
发 送 消息 的 代码 很 简单 ， 调 用 Socket 的 sendto0 函 数 就 可 以 把 按 协 议 写 的 字符 串 信息 
发 出 。 
def sendMessage (pos) : # 发 送 消息 


global s 
global addr 
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Ee 项 目 案 例 开发 
从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


5.sendto (pos .encode () ,addr) 


@ 启动 线程 接收 客户 端的 消息 


启动 线程 接收 客户 端的 消息 
def startNewThread () : 
# 启 动 一 个 新 线程 来 接收 客户 器 端的 消息 


#thread.start new thread(function,args[,kwargs]) 


# 其 中 ，function 参数 是 将 要 调用 的 线程 函数 ，args 是 传递 给 线程 函数 的 参数 ， 它 必须 


# 是 元 组 类 型 ， 而 kwargs 是 可 选 的 参数 

#receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=receiveMessage,args=()) 
thread.setDaemon (True); 


thread.start (); 


络 五 子 棋 的 客户 端 程序 设计 基本 上 与 服务 器 端 相 似 ， 主 要 区 别 在 消息 处 理 上 。 


Wn 和 本 [eye x | 





11 from < -1’, 49358> 


clicked at 6 19 @ 


10 fron (127.8.0.1’, 49358> 


9 fromn 《’127.0.0.1’,. 49358> 











图 14-6 走 棋 过 程 中 打印 的 输出 信息 


14.4.2 ”客户 端 程序 设计 的 步骤 
@ 主 程序 


至 此 完成 服务 器 端 程序 设计 。 图 14-6 所 示 为 服务 器 端 走 棋 过 程 中 打印 的 输出 信息 


定义 含 两 个 棋子 图 片 的 列表 imgs, 创建 Window 窗口 对 象 root, 初始 化 游戏 地 图 map， 
会 制 15x15 的 游戏 棋盘 ， 添 加 显示 提示 信息 的 标签 Label， 绑 定 Canvas 的 鼠标 和 按钮 左 键 


单 击 事件 。 








同时 创建 UDP 通信 客户 端的 SOCKET， 这 里 不 指定 端口 ， 会 自动 绑 定 某 个 空闲 端口 ， 
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于 是 客户 端 SOCKET， 需 要 指定 服务 器 端的 了 P 和 端口 号 ， 并 发 出 连接 服务 器 端 请 求 。 
启动 线程 接收 服务 器 端的 消息 ， 最 后 的 rootmainloop() 方 法 是 进入 窗口 的 主 循环 ， 也 


就 是 显示 窗口 。 














from tkinter import * 

from tkinter.messagebox import * 

import socket 

import threading 

import os 

root=Tk () 

Foot .title ("网 络 五 子 棋 V2 .0 一 UDP 客户 端 ") 

imgs=[PhotoImage (file='D:\\python\\bmp\\Blackstone.gif'), 
PhotoImage (file='D:\\python\\bmp\\Whitestone.gif')] 
turn=0 

Myturn=-1 

eo hae edd es ee ed eB i pre 
range (15)] 

cv=Canvas (root, bg='green', width = 610, height = 610) 
drawQiPan () 

cv.bind("<Button-1>", callback) 

cv.pack() 

labell=Label (root, text=" 客 户 端 . . .") 

labell .pack() 

puttonl=Button (root, text=" 退 出 游戏 ") 
buttonl.bind("<Button-1>", callexit) 

buttonl .pack () 

# 创 建 UDP SOCKET 

Ss=socket . socket (socket .AF INET, socket.SOCK DGRAM) 


port=8000 # 服 务 器 端口 
host="1localhost'" # 服 务 器 地 址 192.168.0.101 
pos="'join|’ #“ 连 接 服务 器 ”命令 
sendMessage (pos); # 发 送 连接 服务 器 请 求 
startNewThread () # 启 动 线程 接收 服务 器 端的 消息 


FeceiveMessage (); 
root .mainloop () 


@ 退出 函数 
“退出 游戏 ”按钮 单 击 事件 的 代码 很 简单 ， 仅 仅 发 送 一 个 "exit" 命 令 协 议 消息 ， 最 后 调 
os. exit(0) 结 束 程序 。 




















def callexit (event): 二 退出 


pos="exit|" 
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sendMessage (pos) 


os. exit (0) 
上 @ 走 棋 函数 
其 功能 与 服务 器 端 相 同 ， 仅 仅 是 提示 信息 不 同 。 


def callback (event) : # 走 棋 
global turn 
global Myturn 
if Myturn==-1: # 第 一 次 确定 自己 的 角色 是 白 方 还 是 黑 方 ) 
Myturn=turn 
SLSeE 
if (Myturn!=turn): 
showinfo (title=" 提 示 ",message=" 还 没 轮 到 自己 走 棋 ") 
return 
#print ("clicked at", event.x, event.y, turn) 
x= (event .x)//40 # 换 算 棋盘 坐标 
y=(event.y)//40 
prinEt ("elicked at™, xr yr turn) 
if map[x] [y] !=" ": 
showinfo (title=" 提 示 ",message=" 已 有 棋子 ") 
else: 
imgl=imgs [turn] 
Cv.create image ((x*40+20,y*40+20),image=img1) 
cv.pack() 
map[x] [y]=str (turn) 
pos=str (x)+", "+str (y) 
sendMessage ("move|"+pos) 
print ("客户 端 走 的 位 置 ", pos) 
labell ["text"]=" 客 户 端 走 的 位 置 "+pos 
# 输 出 输赢 信息 
if win lose()==True: 
if turn==0: 
showinfo (title=" 提 示 ",message=" 黑 方 你 赢 了 ") 
sendMessage ("over | 黑 方 你 赢 了 ") 
Slses 
showinfo (title=" 提 示 ", message=" 白 方 你 赢 了 ") 
sendMessage ("over | 白 方 你 赢 了 ") 
# 换 下 一 方 走 棋 
if turn==0: 
turn=1 
else: 


turn=0 
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@ 画 械 盘 
drawQiPan() 画 15x15 的 五 子 棋 棋 盘 。 
def drawQiPan(): # 画 棋盘 


for i in range(0,15): 

cv.create line(20,20+40*i,580,20+40*i,width=2) 
for i in range(0,15): 

cv.create line(20+40*i,20,20+40*i,580,width=2) 
cv.pack() 


倡 输赢 判断 

win_ lose0 从 4 个 方向 扫描 整个 棋盘 ， 判 断 是 否 连 成 五 子 。 其 功能 与 服务 器 端 相 同 ， 代 
码 没有 区 别 ， 因 此 将 代码 省 略 了 。 

@ 接收 消息 

接收 消息 data, 从 data 字符 串 .split("|") 中 分 割 出 消息 类 型 (move、 join、exit 或 者 over)。 
其 功能 与 服务 器 端 没有 区 别 ， 仅 仅 是 没有 'join' 消 息 类 型 ， 因 为 客户 端 连接 服务 器 ， 而 服务 
器 不 会 连接 客户 端 ， 所 以 少 了 一 个 join' 消 息 类 型 判断 。 

def receiveMessage () : # 接 收 消息 

global s 














while True: 
data=s.recv (1024) .decode ('utf-8') 


a=data.split ("|") # 分 割 数据 
if not data: 
print('server has exited!') 
break 
elif a[0]=="'exit': # 对 方 退 出 信息 


Print (' 对 方 退出 !') 
labell["text"]=' 对 方 退出 ， 游 戏 结束 !，' 
elif a[0]=='over': # 对 方 赢 信 息 
print (' 对 方 赢 信息 !) 
labell["text"]=data.split ("|") [0] 
showinfo (title=" 提 示 ",message=data.split ("|") [1]) 
elif a[0]=='move': 服务 器 端 走 的 位 置信 息 
print('received:',data) 
p=a[1] .split(",") 
x=int (p[0]); 
va 
print (p[0],p[1]) 
labell["text"]=" 服 务 器 端 走 的 位 置 "+p[0]+p[1] 
drawotherChess (x, y) # 画 对 方 棋子 ， 函 数 代码 同 服务 器 端 


s.close() 


@ 发 送 消息 
发 送 消息 的 代码 很 简单 ， 仅 仅 调 用 Socket 的 sendto0) 函 数 ， 就 可 以 把 按 协 议 写 的 字符 
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串 信息 发 出 。 


def sendMessage (pos) : # 发 送 消息 
global s 
s.sendto (pos.encode(), (host, port)) 


人 @ 启动 线程 接收 服务 器 端的 消息 


# 启 动 线程 接收 服务 器 端的 消息 
def startNewThread(): 
# 启 动 一 个 新 线程 来 接收 服务 器 端的 消息 
#thread.start new thread (function,args[,kwargs]) 
# 其 中 ，function 参数 是 将 要 调用 的 线程 函数 ，args 是 传递 给 线程 函数 的 参数 ， 它 必须 
# 是 元 组 类 型 ， 而 kwargs 是 可 选 的 参数 
#receiveMessage 函数 不 需要 参数 ， 只 传 一 个 空 元 组 
thread=threading.Thread (target=receiveMessage,args=()) 
thread.setDaemon (True); 
thread.start (); 


至 此 完成 客户 端 程序 设计 。 
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中 国 象棋 和 五 子 棋 一 样 ， 也 是 一 种 家 喻 户 晓 的 棋 类 游戏 ， 它 的 多 变 吸引 了 无 数 玩家 。 
在 信息 化 的 今天 ， 再 用 纸 棋盘 、 木 棋子 下 象棋 有 点 太 落 伍 ， 能 否 来 点 革新 ， 把 古老 的 象棋 


请 进 计算 机 呢 ? 本 章 介绍 制作 “中 国 象棋 ”游戏 的 原理 和 过 程 。 


15.1 中 国 象棋 介绍 


@ 棋盘 le 

棋子 活动 的 场所 叫 作 “棋盘 ”， 在 长 方形 的 平面 上 ，9 条 平行 的 竖 线 和 ”视频 讲解 
10 条 平行 的 横 线 相交 ， 共 90 个 交叉 点 ， 棋 子 就 摆 在 这 些 交叉 点 上 。 其 中 的 第 5、 第 6 两 横 
线 之 间 未 画 竖 线 的 空白 地 带 称 为 “ 河 界 ” 整个 棋盘 以 “ 河 界 ” 分 为 相等 的 两 部 分 ; 两 方 将 
帅 坐 镇 、 画 有 “ 米 ” 字 方 格 的 地 方 叫 作 “ 九 宫 ”。 

@ 棋子 

象棋 的 棋子 共 32 个 ， 分 为 红 、 黑 两 组 ， 各 16 个 ， 由 对 弈 双方 各 执 一 组 ， 每 组 兵种 是 
一 样 的 ， 各 分 为 7 种 。 

。 红 方 : 帅 、 仕 、 相 、 车 、 马 、 炮 、 兵 。 

。 黑 方 : 将 、 士 、 象 、 车 、 马 、 炮 、 卒 。 
其 中 ， 帅 与 将 、 仕 与 士 、 相 与 象 、 兵 与 卒 的 作用 完全 相同 ， 仅 仅 是 为 了 区 分 红 棋 和 黑 棋 。 

@ 各 棋子 的 走 法 说 明 

1) 是 与 将 

移动 范围 ， 只 能 在 王宫 内 移动 。 

移动 规则 : 每 一 步 只 可 以 水 平 或 垂直 移动 一 点 。 

2) 仕 与 十 

移动 范围 ， 只 能 在 王宫 内 移动 。 

移动 规则 : 每 一 步 只 可 以 沿 对 角 线 方向 移动 一 点 。 
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3) 相 与 象 

移动 范围 : 河 界 的 一 侧 。 

移动 规则 : 每 一 步 只 可 以 沿 对 角 线 方向 移动 两 点 ， 另 外 ， 在 移动 的 过 程 中 不 能 够 穿越 
障碍 。 

4) 马 

移动 范围 : 任何 位 置 。 

移动 规则 : 每 一 步 只 可 以 水 平 或 垂直 移动 一 点 ， 再 按 对 角 线 方向 向 左 或 者 向 右 斜 着 移 
动 一 点 ， 俗 称 “ 马 走 日 ”。 另 外 ， 在 移动 的 过 程 中 不 能 够 穿越 障碍 。 


移动 范围 : 任何 位 置 。 

移动 规则 : 可 以 在 水 平 或 垂直 方向 移动 任意 个 无 阻碍 的 点 。 

6) 炮 

移动 范围 : 任何 位 置 。 

移动 规则 : 移动 起 来 和 车 很 相似 ， 但 它 必 须 跳 过 一 个 棋子 去 吃 掉 对 方 的 一 个 棋子 。 

7) 兵 与 卒 

移动 范围 : 任何 位 置 。 

移动 规则 : 每 一 步 只 能 向 前 移动 一 点 。 过 河 以 后 ， 它 便 增加 了 向 左 / 右 移动 的 能 力 ， 兵 
不 允许 向 后 移动 。 

@ 关于 胜 、 负 、 和 

在 对 局 中 ， 若 出 现下 列 情况 之 一 ， 本 方 输 ， 对 方 赢 : 

(1) 已 方 的 帅 〈 将 ) 被 对 方 棋子 吃 掉 。 

(2) 己方 发 出 认输 请 求 。 

(3) 己方 走 棋 超 出 步 时 限制 。 


15.2 关键 技术 


@ 移动 指定 图 形 对 象 
使 用 move() 方 法 可 以 修改 图 形 对 象 〈 例 如 一 个 棋子 ) 的 坐标 ， 有 具体 语法 如 下 ; 


Canvas 对 象 .move (图 形 对象 , x 坐标 偏 移 量 , y 坐标 偏 移 量 ) 
例如 移动 “是 ”棋子 图 片 向 右 150 像素 、 向 下 150 像素 ， 从 矩形 左上 角 移 到 右 下 角 。 


from tkinter import * 








def callback() : # 事 件 处 理 函 数 
cv.move (rt1,150,150) # 移 动 rt1 

root=Tk () 

root .title(' 移 动 " 帅 "棋子 ') # 设 置 窗口 标题 


# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 
cv=Canvas (root, bg="'white', width=260, height=220) 
imgl=PhotoImage (file=' 红 帅 .png') 
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cv.create rectangle(40,40,190,190,outline='red',fill="'green') 
rtl=cv.create image((40,40),image=img1) # 绘 制 " 帅 "棋子 图 片 
cv.pack() 

buttonl=Button (root, text=" 移 动 棋子 " :Ccommand=callback, fg="red") 
buttonl .pack () 

root .mainloop () 


为 了 对 比 移 动 图 形 对 象 的 效果 , 程序 在 (40.40.190,190) 位 置 绘制 了 一 个 矩形 (由 绿色 填 














充 )， 单 击 “ 移 动 棋子 ”按钮 后 ,“ 帅 ”棋子 rtl 通过 move() 方 法 移动 到 矩形 右 下 角 ， 出 现 
15-1 所 示 的 效果 。 


9 多 诈 机 了 es 


如 





图 























图 15-1 移动 “ 帅 ” 棋 子 图 形 对 象 
@ 删除 指定 图 形 对 象 
使 用 delete() 方 法 可 以 删除 图 形 对 象 〈 例 如 选中 棋子 的 提示 框 )， 有 具体 语法 如 下 : 
Canvas 对 象 .delete (图 形 对象 ) 
将 前 面 例子 中 的 最 后 一 行 改 成 如 下 5 行 : 


def callback21() : # 事 件 处 理 函 数 
cv.delete (rt1) # 删 除 rt1 
button2=Button (root, text=" 删 除 棋子 ", command=callback2, fg="red") 
button2.pack() 
Foot .mainloop () 


单 击 “ 删 除 棋子 ”按钮 ,“ 帅 ”棋子 消失 ， 出 现 如 图 15-2 所 示 的 效果 。 


各 "模子 FETs VW ke 









































图 15-2 ”删除 指定 图 形 对 象 
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15.3 ”中 国 象 棋 的 设计 思路 


@ 棋盘 的 表示 

棋盘 的 表示 就 是 使 用 一 种 数据 结构 来 描述 棋盘 及 棋盘 上 的 棋子 ， 这 里 使 用 一 个 二 维 列 
表 chessmap 来 表示 。 一 个 典型 的 中 国 象棋 棋盘 使 用 9x10 的 二 维 列表 (数组 ) 来 表示 ， 每 
一 个 元 素 代表 棋盘 上 的 一 个 交点 ， 一 个 没有 棋子 的 交点 所 对 应 的 元 素 是 -1。 一 个 二 维 列表 
(数组 ) chessmap 保存 了 当前 棋盘 的 布局 。 当 chessmap[x][y]=i 时 说 明 (x,y) 处 是 棋子 图 像 i， 
否则 chessmap[x][y]=-1， 表 示 此 处 为 空 〈 无 棋子 )。 

该 程序 中 下 棋 的 棋盘 界面 通过 DrawBoard() 函 数 在 Canvas 对 象 cv 上 夯 出 。 

imgl=PhotoImage (file='D:\\python\\bmp\\ 棋 盘 .png') 

def DrawBoard() : # 画 棋盘 


pl=cv.create image((0,0),image=imgl) 


cv.coords (pl1, (360, 400)) # 指 定 棋 盘 图 像 的 中 心 点 坐标 为 (360, 400) 
四 棋子 的 表示 
棋子 的 显示 需要 图 片 ， 每 种 棋子 的 图 案 和 棋盘 使 用 的 对 应 图 片 资源 如 图 15-3 所 示 。 该 
游戏 中 红 方 在 南 ， 黑 方 在 北 。 






































黑车 ,png 是 格 .png 
© © 
黑 象 .png 黑 座 .png 
红 炮 .png 红 仁 ,png 
图 15-3 ”棋子 图 片 资源 
全 走 棋 规 则 





对 于 象棋 来 说 ， 有 马 走 “日 ”、 象 走 “ 田 ”等 一 系列 复杂 的 规则 。 走 法 的 产生 是 博弈 
程序 中 一 个 相当 复杂 而 且 耗 费 运算 时 间 的 工作 ， 不 过 ， 通 过 良好 的 数据 结构 可 以 显著 地 提 
高 生成 的 速度 。 

判断 是 否 能 走 棋 的 算法 如 下 : 

根据 棋子 名 称 的 不 同 ， 按 相应 规则 进行 判断 。 

(1) 如 果 为 “车 ”， 检 查 是 否 走 直线 ， 及 中 间 是 否 有 子 。 
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(2) 如 果 为 “ 马 ”， 检 查 是 否 走 “ 日 ” 字 ， 是 否 整 脚 。 

(3) 如 果 为 “ 炮 ”， 检 查 是 否 走 直线 ， 判 断 是 否 吃 子 ， 如 果 吃 子 ， 则 检查 中 间 是 否 只 
有 一 个 棋子 ， 如 果 不 吃 ， 则 检查 中 间 是 否 有 棋子 。 

(4) 如 果 为 “ 兵 ” 或 “ 卒 ”， 检 查 是 否 走 直线 ， 走 一 步 及 向 前 走 ， 














范 
请 
并 
芯 
要 
区 
噶 


(5) 如 果 为 “将 ”或 “ 帅 ” 检查 是 否 走 直线 ， 走 一 步 及 是 否 超过 范 

(6) 如 果 为 “ 士 ”或 “ 仕 ” 检查 是 否 走 斜 线 ， 走 一 步 及 是 否 超出 范 

(7) 如 果 为 “ 象 ”或 “ 相 ” 检查 是 否 走 “ 田 ” 字 ， 是 否 整 脚 ， 及 是 否 超出 范围 。 

那么 如 何 分 辨 棋子 ? 在 程序 中 采用 了 棋子 图 形 对 象 来 获取 。 

在 该 程序 中 ，IsAbleToPut(id,x,yoldx,oldy) 函 数 实 现 判断 是 否 能 走 棋 并 返回 逻辑 值 ， 它 
的 代码 较 复杂 ， 其 参数 含义 如 下 : 

参数 id 代表 走 的 棋子 图 形 对 象 ， 因 为 dict_ChessName 字典 中 存储 的 是 id 对 应 的 棋子 
名 (例如 " 红 马 ")， 如 果 qi_name = dict_ChessName[id]， 获 取 棋 子 名 含 颜 色 信息 ， 而 字符 串 
[有] 可 以 获取 字符 串 的 第 2 个 字符 ， 所 以 dict_ChessName[id][1] 意 味 着 取 字 符 串 的 第 2 个 字 
符 ， 例 如 " 红 马 " 取 第 2 个 字符 得 到 " 马 "。 

参数 x 和 y 代表 走 棋 的 目标 位 置 。 参 数 oldx 和 oldy 代表 走动 棋子 的 原始 位 置 。 

IsAbleToPut(id, x, y,oldx,oldy) 函 数 实现 走 棋 规则 的 判断 。 

例如 “将 ”或 “ 帅 ” 的 走 棋 规 则 : 只 能 走 一 格 ， 所 以 原 x 坐标 与 新 位 置 x 坐标 之 差 不 
能 大 于 1， 原 y 坐标 与 新 位 置 y 坐标 之 差 不 能 大 于 1。 


if(abs (x-oldx)>1 or abs (Y-oldy) >1) : 





























return False; 
由 于 不 能 走出 九宫 , 所 以 x 坐标 为 3、4、5 且 0<y<2 或 7<y<9( 因 为 走 棋 时 自己 的 “将 ” 
或 “ 帅 ” 只 能 在 九宫 中 )， 否 则 此 步 违规 ， 将 返回 False。 
if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 
最 终 “ 将 ”或 “ 帅 ” 的 走 棋 规则 如 下 : 
#“ 将 ”或 “ 帅 ”的 走 棋 判 断 
if(qi_name==" 将 " or qi _name==" 帅 ") : 
if( (x-oldx)*(y-oldy) !=0) : # 斜 线 走 棋 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 





return False; 
if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 


return True; 


“ 仕 ” 或 “ 士 ” 的 走 棋 规 则 : 只 能 走 斜 线 一 格 ， 所 以 原 x 坐标 与 新 位 置 x 坐标 之 差 为 1， 
且 原 y 坐标 与 新 位 置 y 坐标 之 差 也 为 1。 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
if (qi name==" 士 " or qi _name==" 仕 ") : 
if((x-oldx)*(y-oldy)==0): 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 


return False; 


由 于 不 能 走出 九宫 ， 所 以 x 坐标 为 3、4、5 且 0<y<2 或 7<y<9， 否 则 此 步 违 规 ， 将 返 
回 False。 








if(x<3 or x>5 or (y>=3 and Y<=6) ) : 

return False; 

“ 炮 ”的 走 棋 规则 : 只 能 走 直 线 ， 所 以 x 和 y 不 能 同时 改变 ， 即 (x 一 oldx) * (y -oldy) = 
0 保证 走 直线 。 然 后 判断 如 果 x 坐标 改变 了 ， 原 位 置 oldx 到 目标 位 置 x 之 间 是 否 有 棋子 ， 
如 果 有 ， 则 累加 之 间 棋 的 个 数 ce。 通过 c 是 否 为 1 且 目标 处 非 已 方 棋子 ， 可 以 判断 是 否 可 
以 走 棋 。 同 样 的 方法 判断 “ 炮 ” 的 y 坐 标 改变 时 是 否 可 以 走 棋 。 

“ 兵 ” 或 “ 卒 ”的 走 棋 规 则 :只 能 向 前 走 一 步 ， 根 据 是 否 过 河 检查 是 否 横 走 ， 所 以 x 
与 原 坐标 oldx 改变 的 值 不 能 大 于 1， 同 时 y 与 原 坐 标 oldy 改变 的 值 也 不 能 大 于 1。 例 如 红 
兵 如 果 过 河 即 是 y<5 游戏 时 红 方 在 南 )。 

#“ 座 ”或 “ 兵 ”的 走 棋 判 断 





1£(gL name==" 窜 "or qi name=" 拓 "): # 红 方 在 南 ， 黑 方 在 北 
if((x-oldx) * (y-oldy) !=0) : # 不 是 直线 走 棋 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): # 走 多 步 ， 不 符合 兵 仅 能 走 一 步 


return False; 
if(y>=5 and (x-oldx) !=0 and qi name==" 兵 ") : 
# 红 兵 未 过 河 且 横向 走 棋 
return False; 
if(y<5 and (x-oldx) !=0 and qi name==" 座 ") : # 黑 卒 未 过 河 且 横向 走 棋 


return False; 


if(y-oldy>0 and qi name==" 兵 "): # 兵 后 退 
return False; 
if(y-oldy<0 and qi name==" 卒 ") : # 座 后退 


return False; 
return True; 


其 余 棋 子 的 判断 方法 类 似 ， 这 里 不 再 一 一 介绍 。 

@ 坐标 的 转换 

整个 棋盘 左上 角 的 坐标 为 (0.0)， 右 下 角 的 坐标 为 (8.9)， 如 图 15-4 所 示 。 例 如 “黑车 
的 初始 位 置 即 为 (0.0),“ 黑 将 ”的 初始 位 置 即 为 (4.0),“ 红 帅 ”的 初始 位 置 即 为 (4.9)。 在 走 
棋 过 程 中 ， 需 要 将 鼠标 像素 坐标 转换 成 棋盘 坐标 ， 棋 盘 方 格 的 大 小 是 76 像素 ， 通 过 整除 
76 解析 出 棋盘 坐标 (x,y)。 


zx=(event .x-14)//76 # 换 算 成 棋盘 坐标 
y=(event.y-14)//76 
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图 15-4 棋盘 坐标 示意 图 





15.4 中国 象 棋 实现 的 步骤 


首先 导入 tkinter 库 。 视频 讲解 


from tkinter import * 





from tkinter.messagebox import * 


创建 一 个 Canvas， 设 置 其 背景 色 为 白色 ， 用 Canvas 显示 棋盘 中 所 有 的 棋子 。imgs 是 
PhotoImage 对 象 列表 ， 获 取 所 有 的 棋子 图 片 。 


dict ChessName={} # 定 义 一 个 字典 


例如 ， 本 游戏 中 字典 dict_ChessName 存储 的 内 容 如 下 : 

{2: 黑车 3: 黑马,4: 黑 象 5: 黑土 6;'' 黑 将 ',7: ' 黑 士 ', 8: ' 黑 象 ,9;' 黑 马 ', 10: 黑车 , 11: 
' 黑 卒 。 12: ' 黑 卒 ' 13: ' 黑 卒 , 14: ' 黑 卒 , 15: ' 黑 桩 ,16: ' 黑 炮 ', 17: ' 黑 炮 ', 18: ' 红 车 ', 19: ' 红 马 ', 
20: ' 红 相 ', 21: ' 红 仕 \, 22: ' 红 帅 ', 23: ' 红 仁 ', 24: ' 红 相 ', 25: ' 红 马 ', 26: ' 红 车 ', 27: ' 红 兵 ', 28: ' 红 兵 
', 29: ' 红 兵 ', 30: ' 红 兵 , 31: ' 红 兵 , 32: ' 红 炮 , 33: ' 红 炮 

字典 的 Key 为 每 个 棋子 图 像 的 ia，Value 是 棋子 种 类 名 ， 例 如 图 像 对 象 11 对 应 的 是 黑 
卒 。 因 为 首先 建立 Canvas 对 象 id=0 和 棋盘 对 象 it=1， 所 以 棋子 图 像 的 id 是 从 2 开始 的 。 

Foot=TK () 

# 创 建 一 个 canvas， 设 置 其 背景 色 为 白色 

cv=Canvas (root, bg='white', width=720, height=800) 

chessname=[" 黑 车 ", "黑马 "," 黑 象 ", " 黑 士 ", " 黑 将 "," 黑 士 ", " 黑 象 " "黑马 ", "黑车 "， 

加 

" 红 兵 "," 红 炮 "] 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


imgs=[PhotoImage (file='bmp\\'+chessname[i]+'.png')for i in range(0,22)] 


chessmap=[[-1,-—1,-1,-1,-1,-1,-1,-1,-1,-1]for y in range(10)] 


dict ChessName={} # 定 义 一 个 字典 

LocalPlayer=" 红 " #LocalP1ayer 记录 自己 是 红 方 还 是 黑 方 
first=True # 区 分 是 第 1 次 还 是 第 2 次 选中 的 棋子 
IsMyTurn=True 

rect1=0 

rect2=0 


firstCchessid=0 


程序 运行 时 ， 首 先 调用 DrawBoard0 和 LoadChess() 加 载 棋盘 图 片 和 棋子 到 Canvas 中 ; 
LoadChess0 初 始 化 游戏 区 中 各 个 棋子 的 位 置 ， 红 方 在 南 ， 黑 方 在 北 ， 并 且 在 chessmap 列表 
中 按 坐 标记 录 每 个 棋子 图 像 的 id， 然后 绑 定 Canvas 鼠标 事件 函数 callback0， 也 就 是 鼠标 
单 击 游戏 画面 时 的 处 理 函 数 ， 在 此 函数 中 处 理 游戏 的 走 棋 吃 子 过 程 。 

imgl=PhotoImage (file='bmp\\ 棋 盘 .png') 

def DrawBoard() : # 画 棋盘 




















pl=cv.create image((0,0) ,image=imgl) 
cv.coords (pl, (360, 400) ) 


def LoadChess(): # 加 载 棋 子 


| 288 


global chessmap 
# 黑 方 16 个 棋子 
for i in range(0,9) : 
#" 黑 车 ", "黑马 "," 黑 象 ", " 黑 仕 ", " 黑 将 "," 黑 仕 ", " 黑 象 ", "黑马 ", "黑车 " 
img=imgs [i] 
id=cv.create image((60+76*i,54) ,image=img) ”#76x76 棋盘 格子 大 小 


dict ChessName[id]=chessname[i]; # 图 像 对 应 的 是 哪 种 棋子 
chessmap [i] [0]=id # 图 像 id 
Eor 1 in range(0,S): #5 个 卒 
img=imgs [9] 井 卒 图 像 
id=cv.create image((60+76*2*i,54+3*76),image=img) 
#76x76 棋盘 格子 大 小 
chessmap[i*2] [3]=id 
dict ChessName [id]=" 黑 卒 "7 # 图 像 对 应 的 是 哪 种 棋子 
img=imgs[10] # 黑 方 炮 


ig=cv.create image((60+76*1,54+2*76),image=img) #76x76 棋盘 格子 大 小 
chessmap[1] [2]=id 

dict_chessName [id]=" 黑 炮 "7 塌 图 像 对 应 的 是 哪 种 棋子 
id=cv.create image ((60+76*7,54+2#+76) ,image=img) #76x76 棋盘 格子 大 小 
chessmap[7] [2]=id 

dict_ChessName [id]=" 黑 炮 "; # 图 像 对 应 的 是 哪 种 棋子 

# 红 方 16 个 棋子 

for i in range(0,9) : 


#" 红 车 "," 红 马 "," 红 相 "," 红 仕 "," 红 帅 ",” 红 仕 "," 红 相 ","” 红 马 "," 红 车 " 
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img=imgs [i+11] 
id=cv.create image((60+76*i,54+9*76) ,image=img) #76x76 棋盘 格子 大 小 


dict ChessName[id]=chessname[i+11]; # 图 像 对 应 的 是 哪 种 棋子 
chessmap [i] [9]=id # 图 像 id 
for i in range(0,5): ##5 个 兵 
img=imgs [20] # 兵 图 像 
id=cv.create image((60+76*2*i, 54+6*76)，,image=img) #76x76 棋盘 格子 大 小 
chessmap[i*2] [6]=id # 图 像 id 
dict ChessName[id]=chessname[20]; # 图 像 对 应 的 是 哪 种 棋子 
img=imgs[211] # 红 方 炮 


id=cv.create image((60+76*1,54+7*76)，,image=img) #76x76 棋盘 格子 大 小 
chessmap[1] [7]=id 

dict chessName[id]=" 红 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
id=cv.create image((60+76*7,54+7*76),image=img) #76x76 棋盘 格子 大 小 
chessmap[7] [7]=id 





dict chessName[id]=" 红 炮 "; # 图 像 对 应 的 是 哪 种 棋子 
# 
DrawBoard () # 画 棋盘 
Loadchess () # 加 载 棋子 
# 





print (dict ChessName) 

cv.bind("<Button-1>", callback) 

cv.pack() 

lablel=Label (root，fg='red'，bg='white'，text=" 红 方 先 走 ") “# 提 示 信 息 标签 
lablel['text']=" 红 方 先 走 1" 

lablel .pack () 

root .mainloop () 


游戏 区 的 单 击 事件 处 理 用 户 走 棋 过 程 。 在 用 户 走 棋 时 ， 首 先 要 选中 自己 的 棋子 (第 1 
次 选择 棋子 )， 所 以 有 必要 判断 是 否 单 击 成 对 方 棋子 了 。 如 果 是 自己 的 棋子 , 则 firstChessid 
记录 用 户 选择 的 棋子 ， 同 时 棋子 被 加 上 红色 框 线 示意 被 选中 。 

当 用 户 选 过 己方 棋子 后 ， 单 击 对 方 棋子 〈secondChessid 记录 用 户 第 2 次 选择 的 棋子 ， 
被 加 上 黄色 框 线 )， 则 是 吃 子 ， 如 果 将 或 帅 被 吃 掉 ， 则 游戏 结束 。 当 然 ， 第 2 次 选择 棋子 有 
可 能 是 用 户 改 变 主意 , 选择 自己 的 另 一 棋子 , 则 firstChessid 重新 记录 用 户 选 择 的 己方 棋子 。 

当 用 户 选 过 己方 棋子 后 ， 在 单 击 的 位 置 无 棋子 ， 则 处 理 没有 吃 子 的 走 棋 过 程 。 调 用 
IsAbleToPut(CurSelect, x, y) 判 断 是 否 能 走 棋 ,如果 符合 走 棋 规则 , 移动 棋子 , 修改 chessmap 
记录 的 棋子 信息 。 

def callback(event) : # 走 棋 picBoard MouseClick 

global LocalPlayer 

global chessmap 

global rect1l1,Frect2 # 选 中 框图 像 id 

global firstChessid,secondChessid 

global xl1,x2,yl,y2 

global first 

print ("clicked at", event.x, event.y, LocalPlayer) 
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| 区 本 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


X= (eVent .x-14)//76 # 换 算 棋盘 坐标 
y=(event.y-14)//76 
print ("clicked at", x, y, LocalPlayer) 


T(E) # 第 1 次 单 击 棋子 
Xl1=X; 
yl=y; 
firstChessid=chessmap[x1] [yl1] 
if not (chessmap[xl] [yl1]==-1):  # 此 位 置 不 空 ， 有 棋子 
player=dict ChessName [firstChessid] [0] 
# 获 取 单 击 棋子 的 颜色 ， 例 如“ 红 马 ” 取 红 
if (player!=LocalPlayer): # 颜 色 不 同 
print (" 单 击 成 对 方 棋子 了 !"); 
return 
print ("第 1 次 单 击 ", firstchessid) 
first=False; 
rectl=cv.create rectangle (60+76*x-40, 54+y*76-38, 
60+76*x+80-40, 54+y*76+80-38,outline="red") ，# 画 选中 标记 框 
else: # 第 2 次 单 击 
X2=X; 
Y2=Y7 
secondCchessid=chessmap [x2] [y2] 
# 目 标 处 如 果 是 自己 的 棋子 ， 则 换 上 次 选择 的 棋子 
if not (chessmap [x2] [y2]==-1): # 此 位 置 不 空 ， 有 棋子 
player=dict_ ChessName [secondchessid] [0] # 获 取 单 击 棋子 的 颜色 
if (player==LocalPlayer): # 如 果 是 自己 的 棋子 ， 则 换 上 次 选择 的 棋子 
firstCchessid=chessmap [x2] [y2] 
print ("第 2 次 单 击 ", firstchessid) 
cv.delete (rect1) # 取 消 上 次 选择 的 棋子 标记 框 
X1=X7 
yl=y; 
# 设 置 选 择 的 棋子 颜色 
rectl=cv.create rectangle (60+76*x-40,54+y*76-38, 
60+76*x+80-40, 54+y*76+80-38, outline="red") # 画 选中 标记 框 
print ("第 2 次 单 击 ", firstchessid) 
return; 
else: # 在 落 子 目标 处 画 框 
rect2=cv.create rectangle (60+76*x-40,54+y*76-38, 
60+76*x+80-40, 54+y*76+80-38, outline="yellow") # 目 标 处 画 框 
# 目 标 处 没 棋子 ， 移 动 棋子 
print ("kkkkk", firstCchessid) 
if (chessmap [x2] [y2]==" " or chessmap[x2] [y2]==-1): 
坦 目 标 处 没 棋子 ， 移 动 棋 子 
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print ("目标 处 没 棋子 ， 移 动 棋子 "，, firstchessid, x2, y2, x1,y1) 
if (IsAbleToPut (firstCchessid, x2,y2,zxl,y1)) : # 判 断 是 否 可 以 走 棋 
print ("can 移动 棋子 ", x1, y1) 
cv.move (firstChessid,76*(x2-x1),76*(y2-y1)); 
非洲 六 六 六 六 六 六 六 六 六 来 率 六 来 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 
# 在 map 中 取 掉 原 棋子 
chessmap [x1] [yl1]=-1; 
chessmap[x2] [y2]=firstChessid 
cv.delete (rect1); # 删 除 选 中 标记 框 
cv.delete (rect2); # 删 除 目 标 标记 框 
非洲 六 六 六 六 六 六 六 六 六 六 闵 六 六 六 六 六 六 六 六 六 六 六 来 闵 闵 闵 六 六 六 六 六 六 六 六 六 六 六 闵 六 六 六 六 六 六 半 六 六 六 六 六 六 六 
first=True; 
SetMyTurn (False); # 该 对 方 了 


else: 


# 错 误 走 棋 
print ("不 符合 走 棋 规则 ") ; 
showinfo (title=" 提 示 ",message=" 不 符合 走 棋 规则 ") 


return; 


# 目 标 处 有 棋子 ， 可 以 吃 子 
if (not (chessmap[x2] [y2]==-1) and IsAbleToPut (firstChessid, x2, 
Y2, xl1,Y1)) : # 可 以 吃 子 


first=True; 

print ("can 吃 子 ", x1,y1) 

cv.move (firstChessid,76*(x2-x1),76*(y2-y1)); 

非 染 六 六 六 闵 宗 补 率 率 六 六 六 六 六 六 率 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 六 亲 半 六 六 六 六 六 六 六 六 六 六 六 六 六 半球 亲 

# 在 map 中 取 掉 原 棋子 

chessmap [x1] [yl1]=-1; 

chessmap [x2] [y2]=firstChessid 

cv.delete (secondChessid); 

cv.delete (rect1); 

cv.delete (rect2); 

非 六 六 六 六 六 半 闪 六 六 六 六 六 弟弟 六 六 六 六 六 六 六 六 六 六 六 六 六 率 闵 六 六 六 六 六 六 康 六 六 六 六 六 于 六 六 六 亲 六 亲 亲 亲 

if(dict ChessName [secondchessid] [1]==" 将 ") : #" 将 " 
showinfo (title=" 提 示 ",message=" 红 方 你 赢 了 ") 
return; 

if(dict ChessName [secondchessiqd] [1]==" 帅 "):  #" 帅 " 
showinfo (title=" 提 示 ",message=" 黑 方 你 赢 了 ") 


return; 
#send 
SetMyTurn (False); 砷 该 对 方 了 
else: ## 不 能 吃 子 
print (" 不 能 吃 子 ") 7 


lablel ['text']=" 不 能 吃 子 " 
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cv.delete (rect2) 7 坦 删除 目标 标记 框 


SetMyTurm0 设 置 该 哪 方 走 棋 ，LocalPlayer 记录 轮 到 哪 方 走 棋 ， 并 在 标签 上 显示 提示 
信息 。 


def SetMyTurn (flag): 

global LocalPlayer 

IsMyTurn=flag 

if LocalPlayer==" 红 " : 
LocalPlayer=" 黑 " 
lablel['text']=" 轮 到 黑 方 走 " 

elses 
LocalPlayer=" 红 " 
lablel['text']=" 轮 到 红 方 走 " 


def IsAbleToPut(id,x,y,oldx,oldy) 实 现 判 断 是 否 能 走 棋 并 返回 逻辑 值 ， 其 代码 较 复 杂 。 


def IsAbleToPut (id, x, y, oldx, oldy): 
#oldx，oldy 棋子 在 棋盘 的 原 坐 标 
#x, y 棋子 移动 到 棋盘 的 新 坐标 
qi name=dict ChessName [id] [1] 
# 取 字符 串 中 的 第 2 个 字符 ， 例 如 “ 黑 将 ”中 的 “将 ”， 从 而 得 到 棋子 类 型 
#“ 将 ”或 “ 帅 ” 的 走 棋 判 断 
if(qi name==" 将 " or qi name==" 帅 ") : 
if((x-oldx)*(y-oldy) !=0) : 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 
if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 
return True; 
#“ 什 ”或 “ 士 ” 的 走 棋 判断 
后 (qi_name==" 士 " OF qi_name==" 仕 ") : 
if((x-oldx)*(y-oldy)==0): 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 
return False; 
if(x<3 or x>5 or (y>=3 and y<=6)): 
return False; 
return True; 
#“ 象 ” 或“ 相 ” 的 走 棋 判 断 
if (qi name==" 象 " or qi name==" 相 "): 
if( (x-oldzx)*(y-oldy)==0): 
return False; 
if (abs (x-oldx) !=2 or abs (Y-oldy) !=2) : 


return False; 
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if(y<5 and qi name==" 相 ") : 
return False; 
1f(y>=5 and qi name==" 效 w)': 
return False; 
i=0; j=0; 
if (x-oldx==2): 
i=x-1; 
if (x-oldx==-2): 
i=x+1; 
if(y-oldy==2) : 
3 
if(y-oldy==-2): 
Ve 
if(chessmap[i] {[j]!=-1): 
return False; 
return True; 


#" 马 "的 走 棋 判断 


if (qi name==" 马 "): 


if(abs (x-oldx)*abs (y-oldy) !=2) : 
return False; 
if (x-oldx==2) : 


if (chessmap [x-1] [oldy] !=-1) : 


return False; 
if (x-oldx==-2): 


if (chessmap[x+1] [oldy] !=-1) : 


return False; 
if (y-oldy==2): 


if(chessmap [oldx] [y-1] !=-1): 


return False; 
if (y-oldy==-2): 


if (chessmap[oldx] [y+1] !=-1): 


return False; 
return True; 


#“ 车 ”的 走 棋 判断 


if (qi name==" 车 "): 


# 判 断 是 否 为 直线 
if( (x-oldx)*(y-oldy) !=0) : 


return False; 


判断 是 否 隔 有 棋子 
if (x!=oldx): 
le 
t=x; 
X=O0ldx; 
oldx=t; 
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# 过 河 
# 过 河 


#i、j 必须 有 初始 值 


# 整 象 腿 


# 整 马 腿 
# 整 马 腿 
# 整 马 腿 


# 整 马 腿 
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for i in range (oldx,x+1): 
Ef(il=r and. LsoLldz): 
if(chessmap [i] [yY] !=-1) : 


return False; 


if(y!=oldy): 
if (oldy>y): 
t=y; 
y=oldy; 
oldy=t; 


for j in range(oldy,y+1): 
if(j!=y and j!=oldy): 
if (chessmap [x] [j]!=-1): 
return False; 
return True; 
#“ 炮 ”的 走 棋 判断 
if(qi name==" 炮 ") : 
swapflagx=False; 
swapflagy=False; 
if( (x-oldx)*(y-oldy) !=0) : 
return False; 
c=0; 
if (x!=oldx): 
if (oldx>x): 
t=x; 
Xx=O0ldx; 
oldx=t; 


swapflagx=True; 


for i in range(oldx,x+1): #for (i=oldx; i<=x; i+=1): 


if(i!=x and i!=oldx): 
if (chessmap[i] [y] !=-1) : 
一 C+17 
if(y!=oldy): 
if (oldy>y): 

t=y; 

y=oldy; 

oldy=t; 

swapflagy=True; 


for j in rangel(oldy,y+1): #for(j=oldy; j<=y; j+=1): 


if(j!=y and j!=oldy): 
if (chessmap[x] [j] !=-1) : 
CC > 
a es 
return False; # 与 目标 处 间隔 1 个 以 上 的 棋子 
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SEE 内 # 与 目标 处 无 间隔 棋子 
if(swapflagx==True) : 
t=x; 
X=0ldx; 
oldx=t; 
if (swapflagy==True): 
We 
y=oldy; 
oldy=t; 
if (chessmap[x] [y] !=-1) : 
return False; 
if (c==1): # 与 目标 处 间隔 1 个 棋子 
if (swapflagx==True): 
t=x; 
X=O1dx7 
oldx=t; 
if (swapflagy==True): 
We 
y=oldy; 
oldy=t; 
if (chessmap[x] [y]==-1): # 如 果 目 标 处 无 棋子 ， 则 不 能 走 此 步 
return False; 
return True; 
#“ 座 ”或 “ 兵 ” 的 走 棋 判 断 
if (qi name == " 卒 " or qi name==" 兵 ") : 
if((x-oldx)*(y-oldy) !=0): # 不 是 直线 走 棋 
return False; 
if(abs (x-oldx)>1 or abs(y-oldy)>1): 
# 走 多 步 ， 不 符合 兵 只 能 走 一 步 
return False; 
if(y>=5 and (x-oldx)!=0 and qi name==" 兵 "): 
# 未 过 河 且 横向 走 棋 
return False; 
if(y<5 and (x-oldx) !=0 and qi _ name-==" 府 "): 
坦 未 过 河 且 横向 走 棋 
return False; 
if(y-oldy>0 and qi name==" 兵 "): # 后 退 
return False; 
if(y-oldy<0 and qi name==" 卒 ") : # 后 退 
return False; 
return True; 


return True; 


其 运行 效果 如 图 15-5 和 图 15-6 所 示 。 这 个 游戏 ， 双 方 在 本 机 轮 下 ， 读 者 可 以 根据 网 
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络 五 子 棋 的 UDP 通信 知识 完善 本 游戏 ， 从 而 实现 网 络 版 中 国 象棋 。 













































































图 15-6 中 国 象棋 运行 界面 
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16.1 人 物 拼 图 游戏 介绍 


拼图 游戏 将 一 幅 图 片 分 割 成 若干 拼 块 ， 并 将 它们 随机 打 乱 顺 序 ， 当 将 
所 有 拼 块 都 放 回 原 位 置 时 就 完成 了 拼图 〈 游 戏 结束 )。 
本 人 物 拼图 游戏 为 3 行 3 列 ， 拼 块 以 随机 顺序 排列 ， 玩 家 通过 用 鼠标 











单 击 空白 块 四 周 来 交换 它们 的 位 置 ， 直 到 所 有 拼 块 都 回 到 原 位 置 。 拼 图 游戏 的 运行 界面 如 


16-1 所 示 。 








图 16-1 拼图 游戏 的 运行 界面 
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16.2 ”程序 设计 的 思路 


游戏 程序 首先 将 图 片 分 割 成 相应 的 3 行 3 列 的 拼 块 ， 并 按 顺 序 编号 ,动态 生成 一 个 大 
小 为 3x3 的 列表 board， 存 放 0 一 8 的 数 ， 每 个 数字 代表 一 个 拼 块 (例如 3x3 的 游戏 拼 块 的 
编号 如 图 16-2 所 示 )， 其 中 8 号 拼 块 不 显示 。 

















图 16-2 拼 块 编号 示意 图 


游戏 开始 时 ， 随 机 打 乱 数组 board, 例如 board[0][0] 是 5 号 拼 块 ， 则 在 左上 角 显 示 编号 
是 5 的 拼 块 。 根据 玩家 用 鼠标 单 击 的 拼 块 和 空白 块 所 在 位 置 来 交换 board 数组 对 应 的 元 素 ， 
最 后 通过 判断 元 素 的 排列 顺序 来 判断 是 否 已 经 完成 游戏 。 


16.3 ”关键 技术 
16.3.1 复制 和 粘贴 图 像 区 域 


使 用 crop() 方 法 可 以 从 一 幅 图 像 中 裁剪 指定 区 域 ， 例 如 : 

from PIL import Image 

im=Image.open("D:\\test.jpg") 

box=(100,100, 400, 400) 

region=im.crop (box) 

该 区 域 使 用 四 元 组 来 指定 。 四 元 组 的 坐标 是 ( 左 ,上 , 右 ,下 )。 在 PIL 中 指定 坐标 系 的 左上 
角 坐标 为 (0.0)。 用 户 可 以 旋转 上 面 代码 获取 的 区 域 ， 然后 使 用 paste() 方 法 将 该 区 域 放 回去 ， 
具体 实现 如 下 : 

region=region.transpose (Image .ROTATE 180) # 逆 时 针 旋 转 180° 

im.paste (region, box) 


16.3.2 ”调整 尺寸 和 旋转 


如 果 要 调整 一 幅 图 像 的 尺寸 ， 可 以 调用 resize() 方 法 。 该 方法 的 参数 是 一 个 元 组 ， 用 来 
指定 新 图 像 的 大 小 : 


out=im.resize((128,128)) 
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如 果 要 旋转 一 幅 图 像 ， 可 以 使 用 逆 时 针 方 式 表示 旋转 角度 ， 然 后 调用 rotate() 方 法 : 
out=im.rotate(45) ## 逆 时 针 旋转 45° 


16.3.3 ”转换 成 灰 度 图 像 


对 于 彩色 图 像 ， 不 管 其 图 像 格式 是 PNG、BMP 还 是 JPG， 在 PIL 中 使 用 Image 模块 
的 openO 函 数 打开 后 ， 返 回 的 图 像 对 象 的 模式 都 是 “RGB ”。 对 于 灰 度 图 像 ， 不 管 其 图 像 格 
式 是 PNG、BMP 还 是 JPG， 打 开 后 模式 都 为 “L”。 

对 于 PNG、BMP 和 JPG 彩 色 图 像 格式 之 间 的 互相 转换 ,都 可 以 通过 Image 模 块 的 open() 
和 save() 函 数 来 完成 。 具 体 来 说 就 是 ， 在 打开 这 些 图 像 时 PIL 会 将 它们 解码 为 三 通道 的 
“RGB” 图 像 ， 用 户 可 以 基于 这 个 “RGB” 图 像 对 其 进行 处 理 ， 处 理 完毕 后 使 用 saveO 函 数 
可 以 将 处 理 结果 保存 成 PNG、BMP 和 JPG 中 的 任何 格式 ， 这 样 也 就 完成 了 几 种 格式 之 间 
的 转换 。 当 然 ， 对 于 不 同 格式 的 灰 度 图 像 ， 也 可 以 通过 类 似 途径 完成 ， 只 是 PIL 解码 后 是 
模式 为 “IL” 的 图 像 。 

这 里 详细 介绍 一 下 Image 模块 的 convert0 函 数 ， 用 于 不 同 模式 图 像 之 间 的 转换 。 

convert() 函 数 有 3 种 形式 的 定义 ， 它 们 的 定义 形式 如 下 : 


im.convert (mode) 
im.convert ('P', **options) 











im.convert (mode, matrix) 

使 用 不 同 的 参数 ， 将 当前 的 图 像 转换 为 新 的 模式 (在 PIL 中 有 9 种 不 同 模式 ， 分 别 为 
1、L、P、RGB、RGBA、CMYK、YCbCr、I、F)， 并 产生 新 的 图 像 作 为 返回 值 。 

例如 : 

from PIL import Image # 或 直接 import Image 

im=Image.open('a.jpg') 

iml=im.convert ('L') # 将 图 片 转换 成 灰 度 图 

“L” 模 式 的 图 像 为 灰色 图 像 ， 它 的 每 个 像素 用 8 个 bit 表示 ，0 表示 黑 ，255 表示 白 ， 
其 他 数字 表示 不 同 的 灰 度 。 在 PIL 中 ， 从 “RGB” 模 式 转换 为 “L” 模 式 是 按照 下 面 的 公 
式 进行 的 : 

















L=R*299/1000+G*587/1000+ B*114/1000 
打开 图 片 并 转换 成 灰 度 图 的 方法 如 下 : 


im=Image.open('a.jpg') .convert ('L) 


如 果 转 换 成 黑白 图 像 〈 二 值 图 像 )， 也 就 是 模式 为 “1” 的 图 像 〈 非 黑 即 白 )， 它 的 每 
个 像素 用 8 个 bit 表示 ，0 表示 黑 ，255 表示 白 。 下 面 将 彩色 图 像 转换 为 黑白 图 像 。 


from PIL import Image # 或 直接 import Image 











im=Image.open('a.jpg') 


iml=im.convert ('1') # 将 彩色 图 像 转 换 成 黑白 图 像 
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16.3.4 ”对 像素 进行 操作 


getpixel(x.y) 用 于 获取 指定 像素 的 颜色 ， 如 果 图 像 为 多 通道 ， 则 返回 一 个 元 组 。 该 方法 
的 执行 比较 慢 ， 如果 用 户 需要 使 用 Python 处 理 图 像 中 的 较 大 部 分 数据 ， 可 以 使 用 像素 访问 
对 象 (load0) 或 者 getdata() 方 法 )。putpixel(xy,color) 可 以 改变 单个 像素 点 的 颜色 。 

img=Image .open ("smallimg .png") 

img.getpixel ((4,4)) # 获 取 像 素 的 颜色 

img.putpixel ((4,4), (255,0,0)) # 改 变 单个 像素 点 为 红色 

img.save ("imgl .png", "png") 

说 明 : getpixel0 得 到 图 片 img 的 坐标 为 (4,4) 的 像素 点 ，putpixel0 将 坐标 为 (4,4) 的 像素 
点 变 为 (255,0,0) 的 颜色 ， 即 红色 。 


16.4 程序 设计 的 步骤 





























16.4.1 Python 处 理 图 片 切割 


使 用 PIL 库 的 Image 模块 中 的 crop() 方 法 可 以 从 一 幅 图 像 中 裁剪 指定 区 域 ， 该 区 域 使 
用 四 元 组 来 指定 , 四 元 组 的 坐标 是 ( 左 ,上 ., 右 ,下 )。 在 PIL 中 指定 坐标 系 的 左上 角 坐标 为 (0.0)。 
其 具体 实现 如 下 : 

from PIL import Image 

img=Image .open (r'C:\woman.jpg') 

box=(100,100,400, 400) 


region=img.crop (box) # 裁 切 图 片 
# 保 存 裁 切 后 的 图 片 


region.save('crop.jpg') 

在 本 游戏 中 需要 把 图 片 分 割 成 3 行 X3 列 的 图 片 块 ， 在 上 面 的 基础 上 指定 不 同 的 区 域 
即 可 裁剪 、 保 存 。 为 了 更 通用 一 些 ， 编 成 splitimage(src,rownum,colnum,dstpath) 函 数 ， 实 现 
将 指定 的 src 图 片 文 件 分 割 成 rownumxcolnum 数量 的 小 图 片 块 。 其 具体 实现 如 下 : 


import os 

















from PIL import Image 
def splitimage(src, rownum, colnum, dstpath): 
img=Image.open (src) 
w, h=img.size # 图 片 大 小 
if rownum<=h and colnum<=w: 
print('Original image info: Ssx%5s, $5, $5' $ (w, h, img.format, 


img .mode)) 
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print (" 开 始 处 理 图 片 切割 ， 请 稍 候 …") 
s=os.-path.split(src) 


Eastpatn # 没 有 输入 路 径 
dstpath=s[0] # 使 用 源 图 片 所 在 目录 s [0] 

En=3 0 sp (wy #s[I1] 是 源 图 片 文件 名 

basename=fn[0] ## 主 文件 名 

ext=fn[-1] # 扩 展 名 

num=0 

rowheight = h #rownum 

colwidth = w #colnum 


for r in range (rownum): 
for c in range (Colnum) : 
box=(c*colwidth, r*rowheight, (c+1)*colwidth, (r+1)*rowheight) 
img.crop (box) .save (os.path.join(dstpath, basename+' ' + 
str (num)+'.'+ext)) 
num=num+1 
print (' 图 片 切割 完毕 ， 共 生成 ss 张 小 图 片 。' $$ num) 
IE 
print (" 不 合法 的 行列 切割 参数 ! ') 
src=input (" 请 输入 图 片 文件 路 径 ，') 
#src="C: \woman.png" 
if os.path.isfile (src): 
dstpath=input (' 请 输入 图 片 输出 目录 (不 输入 路 径 则 表示 使 用 源 图 片 所 在 目录 ): ') 
if (dstpath=='') or os.path.exists (dstpath): 
row=int (input (! 请 输入 切割 行 数 : ') ) 
col=int (input (" 请 输入 切割 列 数 : ') ) 
if row>0 and col>0: 
splitimage (src, row, col, dstpath) 
Slses 
print (' 无 效 的 行列 切割 参数 ! ') 
LS 
print (' 图 片 输出 目录 $s 不 存在 ! ' s dstpath) 
SLses 


print (' 图 片 文件 ss 不 存在 ! ' % src) 
运行 结果 如 下 : 
请 输入 图 片 文件 路 径 : C:\woman .png 
请 输入 图 片 输出 目录 (不 输入 路 径 则 表示 使 用 源 图 片 所 在 目录 ): 
请 输入 切割 行 数 : 3 
请 输入 切割 列 数 : 3 
Original image info: 283x212, PNG, RGBA 


开始 处 理 图 片 切割 ， 请 稍 候 … 
图 片 切割 完毕 ， 共 生成 9 张 小 图 片 。 
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16.4.2 ”游戏 的 逻辑 实现 


@ 定义 常量 及 加 载 图 片 


from tkinter import * 

from tkinter.messagebox import * 
import random 

# 定 义 常量 

# 画 布 的 尺寸 

WIDTH=312 

HEIGHT=450 

# 图 像 块 的 边 长 

IMAGE WIDTH=WIDTH // 3 

IMAGE HEIGHT=HEIGHT // 3 


# 游 戏 的 行 / 列 数 

ROWS=3 

COLS=3 

# 移 动 步 数 

steps=0 

# 保 存 所 有 图 像 块 的 列表 

board=[[0, 1, 2], 
[3, 4, 5], 
[I pe | 


root=Tk(' 拼 图 2017') 

root .title ("拼图 -- 夏 敏捷 2017-10-5") 

# 载 入 外 部 事先 生成 的 9 个 小 图 像 块 

Pics=[] 

for i in range(9) : 
filename="woman "+str(i)+".png" 
Pics.append (PhotoImage (file=filename)) 


@ 图 像 块 类 





每 个 图 像 块 ( 拼 块 ) 是 一 个 Square 对 象 ,具有 draw 功能 ,即将 本 拼 块 图 片 绘制 到 Canvas 


-。orderID 属性 是 每 个 图 像 块 〈 拼 块 ) 对 应 的 编号 。 


# 图 像 块 〈 拼 块 ) 类 
class Square : 
def init (self, orderID): 
self.orderID=orderID 
def drawl(self, canvas, board pos): 
img=Pics[self.orderID] 
canvas.create image (board pos, image=img) 


@ 初始 化 游戏 





random.shuffle(board) 打 乱 二 维 列表 只 能 按 行进 行 ， 所 以 使 月 
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一 维 列表 来 实现 编号 的 打 
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乱 。 在 打 乱 图 像 块 后 ， 根 据 编 号 生成 对 应 的 图 像 块 〈 拼 块 ) 到 board 列表 中 。 


Road 
# 打 乱 图 像 块 
LIL=list (range (9)) #T 列表 中 [0,1,2,3,4,5,6,7,8] 
random. shuffle (L) 
# 填 充 拼图 板 
for i in range (ROWS): 
for j] in range (COLS): 
idx=i*ROWS+j 





orderID=L[idx] 
if orderID is 8: #8 号 拼 块 不 显示 ， 所 以 存 为 None 
board[i] [j]=None 
else: 
board[i] [j]=Square (orderID) 
人 @ 绘制 游戏 界面 中 的 各 元 素 
def drawBoard (canVas) : 
# 画 黑 框 
canvas.create polygon((0, 0, WIDTH, 0, WIDTH, HEIGHT, 0, HEIGHT), 
width=1,outline='Black') 
# 画 所 有 图 像 块 
for i in range (ROWS): 
for j in range (COLS) : 
if board[i][j] is not None: 


board[i] [j] .draw(canvas， (IMAGE WIDTH*(j+0.5),IMAGE 
HEIGHT* (i+0.5))) 


@ 鼠标 事件 
将 单 击 位 置换 算 成 拼图 板 上 的 棋盘 坐标 ， 如 果 单 击 空位 置 ， 什 么 也 不 移动 ， 否 则 依次 
检查 被 单 击 当前 图 像 块 的 上 、 下 、 左 、 右 是 否 有 空位 置 ， 如 果 有 ， 就 移动 当前 图 像 块 。 








def mouseclick (pos): 
global steps 
# 将 单 击 位 置换 算 成 拼图 板 上 的 棋盘 坐标 
r=int (pos.y // IMAGE HEIGHT) 
c=int (pos.x // IMAGE WIDTH) 


ne # 单 击 位 置 在 拼图 板 内 才 移 动 图片 
if board[r] [c] is None: # 单 击 空 位 置 ,什么 也 不 移动 
return 
else: 


# 依 次 检查 被 单 击 当前 图 像 块 的 上 、 下 、 左 、 右 是 否 有 空位 置 ， 如 果 有 ， 就 移动 当前 图 像 块 


current_ square=board[r] [c] 


if r-1>=0 and board[r-1][c] is None: ## 判 断 上 面 
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| 沪 要 项 目 案例 开 


从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 


board[r] [cl]=None 
board[r-1] [c]=current square 
steps+=1 
elif c+1<=2 and board[r][c+l1] is None: 音 判 断 右面 
board[r] [c]=None 
board[r] [c+1]=current Square 
stepst+=1 
elif r+l<=2 and board[r+1][c] is None: 间 判 断 下 面 
board[r] [c]=None 
board[r+1] [c]=current Square 
steps+=1 
elif c-1>=0 and board[r] [c-1] is None: 彰 判 断 左面 
board[r] [c]=None 
board[r] [c-1]=current square 
steps+=1 
#print (board) 
labell["text"]=" 步 数 : "+str (steps) 
cv.delete('all') # 清 除 画 布 上 的 内 容 
drawBoard (cv) 
if win(): 
showinfo (title=" 巷 喜 ", message=" 你 成 功 了 ! ") 


@ 输赢 的 判断 
判断 拼 块 的 编号 是 否 为 有 序 的 ， 如 果 不 是 有 序 的 ， 则 返回 False。 


def win() : 
for i in range (ROWS) : 
for j in range (COLS) : 
if board[i] [j] is not None and board[i][j] .orderID!=i * ROWS + j: 
return False 


return True 


@ 重 置 游戏 


def play game(): 
global steps 
steps=0 
init board() 


人 @““ 重 新 开始 ”按钮 的 单 击 事件 


def callBack2(): 
print ("重新 开始 ") 
play_game () 
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cv.delete('all') # 清 除 画 布 上 的 内 容 


drawBoard (cv) 


主 程序 


# 设 置 窗口 

cv=Canvas (root, bg="'green', width=WIDTH, height=HEIGHT) 
bl=Button (root, text=" 重 新 开始 ", command=callBack2, width=20) 
labell=Label (root, text=" 步 数 : "+str (steps) ,fg="red",width=20) 
labell .pack () 

cv.bind("<Button-1>", mouseclick) 

cv.pack() 

bl.pack() 

Play game () 

drawBoard (cv) 

root .mainloop() 


至 此 完成 人 物 拼图 游戏 设计 。 
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Pygame 最 初 由 Pete Shinners 开发 ， 它 是 一 个 跨 平台 的 Python 模块 ， 专 为 电子 游戏 设 
计 , 包含 图 像 、 声 音 功 能 和 网 络 支 持 ， 这 些 功 能 使 开发 者 很 容易 用 Python 写 一 个 游戏 。 虽 
然 不 使 用 Pygame 也 可 以 写 一 个 游戏 , 但 如 果 能 充分 利用 Pygame 库 中 已 经 写 好 的 代码 , 开 
发 要 容易 得 多 。Pygame 能 把 游戏 设计 者 从 低级 语言 (例如 C 语言 ) 的 束缚 中 解放 出 来 ， 
专注 于 游戏 逻辑 本 身 。 

由 于 Pygame 很 容易 使 用 且 跨 平台 , 所 以 在 游戏 开发 中 十 分 受 欢迎 。 因为 Pygame 是 开 





放 源 代码 的 软件 ， 也 促使 一 大 批 游戏 开发 者 为 完善 和 增强 它 的 功能 而 努力 。 


17.1 Pygame 基础 知识 


17.1.1 安装 Pygame 库 





在 开发 Pygame 程序 之 前 , 需要 安装 Pygame 库 。 用 户 可 以 通过 Pygame ”国电 而 
的 官方 网 站 “http:/www.pygame.org/download.shtml1” 下 载 源 文件 ， 安 装 指 视频 讲解 
导 也 可 以 在 相应 页 面 找到 。 

一 旦 安装 了 Pygame， 就 可 以 在 IDLE 交互 模式 中 输入 以 下 语句 检验 是 否 安装 成 功 : 


>>> import pygame 
>>> print (pygame .ver) 
1.9.2a0 


1.9.2 是 Pygame 的 最 新 版 本 ， 读 者 也 可 以 找 一 找 其 他 更 新 的 版 本 。 


17.1.2 ”Pygame 的 模块 
Pygame 有 大 量 可 以 被 独立 使 用 的 模块 。 对 于 计算 机 的 常用 设备 , 都 有 对 应 的 模块 进行 
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控制 ， 另 外 还 有 其 他 一 些 模块 ， 例 如 pygame.display 是 显示 模块 、pygame .keyboard 是 键盘 


模块 、pygame.mouse 是 鼠标 模块 ， 如 表 17-1 所 示 。 








表 17-1 Pygame 软件 包 中 的 模块 
模 块 名 功 能 
pygame.cdrom 访问 光驱 
pygame.cursors 加 载 光标 

















pygame.display 访问 显示 设备 
pygame.draw 绘制 形状 、 线 和 点 
pygame.event 管理 事件 
pygame.font 使 用 字体 
pygame.image 加 载 和 存储 图 片 
pygame.joystick 使 用 游戏 手柄 或 者 类 似 的 东西 
pygame key 读 取 键 盘 按 键 
pygame.mixer 声音 
pygame.mouse 鼠标 
pygame.movie 播放 视频 
pygame.music 播放 音频 


pygame.overlay 
pygame 
pygame.rect 
pygame.sndarray 
pygame.sprite 
pygame.surface 
pygame.surfarray 
pygame.time 


pygame.transform 


访问 高 级 视频 疮 加 

Python 模块 ， 专 为 电子 游戏 设计 
管理 矩形 区 域 

操作 声音 数据 

操作 移动 图 像 

管理 图 像 和 屏幕 
管理 点 阵 图 像 数 据 

管理 时 间 和 帧 信息 
缩放 和 移动 图 像 


建立 Pygame 项 目 和 建立 其 他 Python 项 目的 方法 一 样 ， 在 IDLE 或 文本 编辑 器 中 新 建 
一 个 空 文档 ， 需 要 告诉 Python 该 程序 用 到 了 Pygame 模块 。 
为 了 实现 此 目的 ， 这 里 使 用 一 个 import 指令 ， 该 指令 告诉 Python 载 入 外 部 模块 。 例 





如 输入 下 面 两 行 在 新 项 目 中 引入 必要 的 模块 : 


import pygame, sys, time, random 
from pygame.locals import * 


第 1 行 引入 Pygame 的 主要 模块 、sys 模块 、time 模块 和 random 模块 。 
第 2 行 告诉 Python 载 入 pygame.locals 的 所 有 指令 使 它们 成 为 原生 指令 ， 这 样 在 使 用 


这 些 指令 时 就 不 需要 用 全 名 调用 。 


























1 于 硬件 和 游戏 的 兼容 性 或 者 请 求 的 驱动 没有 安装 的 问题 ， 有 些 模块 可 能 在 某 些 平台 


上 不 存在 ， 可 以 用 None 测试 一 下 。 例 如 测试 字体 是 否 载 入 : 





if pygame .font is None: 
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| 芝 要 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 
print ("The font module is not available!") 


pygame .quit () # 如 果 没 有 则 退出 Pygame 的 应 用 环境 
下 面 对 常 用 模块 进行 简要 说 明 。 
和 pygame.surface 
该 模块 中 有 一 个 surface() 函 数 ，surface() 函 数 的 一 般 格式 如 下 : 


pygame.surface( (width, height), flags=0, depth=0, masks=none) 


它 返 回 一 个 新 的 surface 对 象 。 这 里 的 surface 对 象 是 一 个 有 确定 尺寸 的 空 图 像 ， 可 以 
它 进行 图 像 的 绘制 与 移动 。 

@ pygame.locals 

在 pygame.locals 模块 中 定义 了 Pygame 环境 中 用 到 的 各 种 常量 ， 而 且 包 括 事件 类 型 、 
按键 和 视频 模式 等 的 名 字 ， 在 导入 所 有 内 容 (from pygame.locals import *) 时 用 起 来 很 
安全 。 

如 果 用 户 知道 需要 的 内 容 ， 也 可 以 导入 具体 的 内 容 (例如 from pygame.locals import 
FULLSCREEN )。 

@ pygame.display 

pygame.display 模块 包括 处 理 Pygame 显示 方式 的 函数 , 其 中 包括 普通 窗口 和 全 屏 模式 。 

游戏 程序 通常 需要 下 面 的 函数 : 

1) flipO/update() 

(1) flip0: 更 新 显示 。 一 般 来 说 , 在 修改 当前 屏幕 的 时 候 要 经 过 两 步 ， 首 先 需要 对 get_ 
surface() 函 数 返 回 的 surface 对 象 进行 修改 ， 然 后 调用 pygame.display.flip0 更 新 显示 以 反映 
所 做 的 修改 。 

(2) update0: 在 只 想 更 新 屏幕 一 部 分 的 时 候 使 用 update0 函 数 ， 而 不 是 flip0 函 数 。 

2) set mode() 

该 函数 建立 游戏 窗口 ， 返 回 surface 对 象 。 它 有 3 个 参数 ,第 1 个 参数 是 元 组 ， 用 于 指 
定 窗口 的 尺寸 ; 第 2 个 参数 是 标志 位 ， 具 体 含义 如 表 17-2 所 示 ， 例 如 FULLSCREEN 表示 
全 屏 ， 默 认 值 为 不 对 窗口 进行 设置 ， 读 者 可 根据 需要 选用 ， 第 3 个 参数 为 色 深 ， 用 于 指定 
窗口 的 色彩 位 数 。 



























































表 17-2 set_mode 的 窗口 标志 位 的 参数 取 值 














窗口 标志 位 功 能 
FULLSCREEN 创建 一 个 全 屏 窗口 
DOUBLEBUF 创建 一 个 “ 双 缓冲 ”窗口 ， 建 议 在 HWSURFACE 或 者 OPENGL 时 使 用 
HWSURFACE 创建 一 个 硬件 加 速 的 窗口 ， 必 须 和 FULLSCREEN 同时 使 用 
OPENGL 创建 一 个 OPENGL 演 染 的 窗口 
RESIZABLE 创建 一 个 可 以 改变 大 小 的 窗口 
NOFRAME 创建 一 个 没有 边框 的 窗口 


3) set caption() 
该 函数 设 定 游戏 程序 的 标题 。 当 游戏 以 窗口 模式 〈 对 应 于 全 屏 ) 运行 时 尤其 有 用 ， 








Es 
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为 该 标题 会 作为 窗口 的 标题 。 

4) get surface() 

该 函数 返回 一 个 可 用 来 画图 的 surface 对 象 。 

© pygame.font 

pygame.font 模块 用 于 表现 不 同 字体 ， 可 以 用 于 文本 。 

© pygame.sprite 

pygame.sprite 模块 有 两 个 非常 重要 的 类 一 sprite 精灵 类 和 group 精灵 组 。 

sprite 精灵 类 是 所 有 可 视 游 戏 的 基 类 。 为 了 实现 自己 的 游戏 对 象 ， 需 要 子 类 化 sprite， 

盖 它 的 构造 函数 ， 以 设 定 image 和 rect 属性 (决定 sprite 的 外 观 和 放置 的 位 置 )， 再 覆盖 

update() 方 法 。 在 sprite 需要 更 新 的 时 候 可 以 调用 update() 方 法 。 

group 精灵 组 的 实例 用 作 sprite 精灵 对 象 的 容器 。 在 一 些 简单 的 游戏 中 ， 只 要 创建 名 为 
sprites、allsprite 或 是 其 他 类 似 的 组 ， 然 后 将 所 有 sprite 精灵 对 象 添加 到 上 面 即 可 。 当 group 
精灵 组 对 象 的 update() 方 法 被 调用 时 会 自动 调用 所 有 sprite 精灵 对 象 的 update() 方 法 。group 
精灵 组 对 象 的 clear0 方 法 用 于 清理 它 包含 的 所 有 sprite 对 象 〈 使 用 回调 函数 实现 清理 )， 
group 精灵 组 对 象 的 draw() 方 法 用 于 绘制 所 有 的 sprite 对 象 。 

©@ pygame.mouse 

该 模块 用 来 管理 鼠标 。 

。 pygame.mouse.set_visible(False/true): 隐藏 /显示 鼠标 光标 。 

。 pygame.mouse.get_pos(): 获取 鼠标 位 置 。 

(7) pygame.event 

pygame.event 模块 会 追踪 鼠标 单 击 、 鼠 标 移动 、 按 键 按 下 和 释放 等 事件 。 其 中 , pygame 
.event.get 0 可 以 获取 最 近 事件 列表 。 

【8) pygame.image 

这 个 模块 用 于 处 理 保存 在 GIF、PNG 或 者 JPEG 内 的 图 形 ， 用 户 可 以 用 load0 函 数 来 
读 取 图 像 文 件 。 












































17.2 Pygame 的 使 用 


本 节 主 要 讲解 用 Pygame 开发 游戏 的 逻辑 、 鼠 标 事件 的 处 理 、 键 盘 事 件 的 处 理 、 字 体 
的 使 用 和 声音 的 播放 等 基础 知识 ， 最 后 以 一 个 “移动 的 坦克 ”例子 来 体现 这 些 基 础 知识 的 
应 用 。 


17.2.1 Pygame 开发 游戏 的 主要 流程 


Pygame 开发 游戏 的 基础 是 创建 游戏 窗口 , 核心 是 处 理事 件 、 更 新 游戏 状态 和 在 屏幕 上 
绘图 。 游 戏 状态 可 理解 为 程序 中 所 有 变量 值 的 列表 。 在 有 些 游戏 中 ， 游 戏 状态 包括 存放 人 
物 健康 和 位 置 的 变量 、 物 体 或 图 形 位 置 的 变化 ， 这 些 值 可 以 在 屏幕 上 显示 。 

物体 或 图 形 位 置 的 变化 只 有 通过 在 屏幕 上 绘图 才能 看 出 来 。 
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Pe 项 目 案例 开发 





从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 




































可 以 简单 地 抽象 出 Pygame 开发 游戏 的 主要 流程 ， 如 图 17-1 所 示 。 
Cw ) | 
了 
初始 化 Pygame 
1 
载 入 游戏 相关 图 片 
! 修改 游戏 的 状态 信息 
创建 游戏 窗口 
1 
! 在 屏幕 
进入 事件 循环 






































图 17-1 Pygame 开发 游戏 的 主要 流程 


下 面 举 一 个 具体 例子 来 说 明 。 


圆 77-! 使 用 Pygame 开发 一 个 显示 “Hello World! ”标题 的 游戏 窗口 。 


























import pygame # 导 入 pygame 模块 
from pygame.locals import * 


import sys 
def hello world() : 
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pygame.init () # 任 何 Pygame 程序 均 需 要 执行 此 语句 进行 模块 的 初始 化 
# 设 置 窗口 的 模式 ，(680, 480) 表示 窗口 像素 

# 此 函数 返回 一 个 surface 对 象 ， 本 程序 不 使 用 它 ， 故 没 保存 到 对 象 变量 中 
pygame.display.set mode((680,480)) 

pygame.display.set caption('Hello World!') # 设 置 窗口 标题 


# 无 限 循 环 ， 直 到 接收 到 窗口 关闭 事件 
while True: 
# 处 理事 件 
for event in pygame.event.get(): 
if event.type==QUIT: # 接 收 到 窗口 关闭 事件 
pygame .quit () ## 退 出 
sys.exit () 
# 将 surface 对 象 绘制 在 屏幕 上 
pygame.display.update() 
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if _ name ==" main ": 


hello world() 
程序 运行 后 仅见 到 黑色 的 游戏 窗口 ， 标 题 是 “Hello World!”， 如 图 17-2 所 示 。 
[= | 








区 hello wondl 














图 17-2 用 Pygame 开发 的 游戏 窗口 


在 导入 Pygame 模块 后 ， 任 何 Pygame 游戏 程序 均 需 要 执行 pygame.init() 语 句 进 行 模块 
的 初始 化 ， 它 必须 在 进入 游戏 的 无 限 循环 之 前 被 调用 。 这 个 函数 会 自动 初始 化 其 他 所 有 模 
块 (例如 pygame.font 和 pygame.image)， 通 过 它 载 入 驱动 和 硬件 请 求 ， 这 样 游 戏 程序 才 可 
以 使 用 计算 机 上 的 所 有 设备 ， 比 较 费 时 间 。 如 果 只 使 用 少量 模块 ， 应 该 分 别 初始 化 这 些 模 
块 以 节省 时 间 ， 例 如 pygame.sound.initO 仅 仅 初 始 化 声音 模块 。 

该 代码 中 有 个 无 限 循环 ， 每 个 Pygame 程序 都 需要 它 ， 在 无 限 循环 中 可 以 做 以 下 操作 。 

(1) 处 理事 件 ， 例如 鼠标 、 键 盘 、 关 闭 窗口 等 事件 。 

(2) 更 新 游戏 状态 ， 例 如 坦克 的 位 置 变化 、 数 量变 化 等 。 

(3) 在 屏幕 上 绘图 ， 例 如 绘制 新 的 敌 方 坦克 等 。 

不 断 重 复 上 面 的 3 个 步 又， 从 而 完成 游戏 逻辑 。 

在 本 例 代 码 中 仅仅 处 理 关闭 窗口 事件 , 也 就 是 玩家 关闭 窗口 时 pygame.quit() 退 出 游戏 。 


17.2.2 ”Pygame 的 图 像 /图 形 绘制 


@ Pygame 的 图 像 绘制 

Pygame 支持 多 种 存储 图 像 的 方式 〈 也 就 是 图 片 格式 )， 例 如 JPEG、PNG 等 ， 具 体 支 
持 JPEG (一 般 扩 展 名 为 .jpg 或 者 jpeg， 数 码 相 机 、 网 上 的 图 片 基本 上 都 是 这 种 格式 ， 这 是 
一 种 有 损 压 缩 方 式 ， 尽 管 对 图 片 的 质量 有 些 损坏 ， 但 对 于 减 小 文件 尺寸 非常 棒 ， 其 优点 很 

















多 ， 只 是 不 支持 透明 )、PNG (支持 透明 ， 无 损 压 缩 )、GIF〈 网 上 使 用 的 很 多 ， 支 持 透 明 
和 动画 , 但 只 能 有 256 种 颜色 , 在 软件 和 游戏 中 的 使 用 很 少 ) 以 及 BMP、PCX、TGA、TIF 


等 格式 。 


看 
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Pygame 使 用 surface 对 象 来 加 载 绘制 的 图 像 。 对 于 Pygame， 加 载 图 片 使 用 pygame 
.image.load()， 给 它 一 个 文件 名 然后 就 返回 一 个 surface 对 象 。 尽 管 读 入 的 图 像 格式 不 同 ， 
但 surface 对 象 隐 藏 了 这 些 不 同 。 用 户 可 以 对 一 个 surface 对 象 进行 涂 画 、 变 形 、 复 制 等 各 
种 操作 。 事 实 上 , 游戏 屏幕 也 只 是 一 个 surface, pygame.display set mode0 返 回 了 一 个 surface 
对 象 。 

对 于 任何 一 个 surface 对 象 , 可 以 用 get_width()、get_height() 和 gei_size() 函 数 来 获取 它 
的 尺寸 ，get_rectO 用 来 获取 它 的 区 域 形 状 。 

[ 贺 17-2 使 用 Pygame 开发 一 个 显示 坦克 自由 移动 的 游戏 窗口 。 




















import pygame 
from pygame.locals import * 
import sys 
def Play tank() : 
Pygame .init() 


window size=(width, height)=(600, 400) # 窗 口 大 小 

speed=[1, 1] # 坦 克 运行 偏 移 量 ， 即 [水 平 , 垂直 ] ， 值 越 大 ， 移 动 越 快 
color black=(255, 255, 255) # 窗 口 背 景色 RGB 值 ( 白 色 ) 
screen=pygame .display.set mode (window size) 坦 设置 窗口 模式 

pygame .display.set _caption(' 自 由 移动 的 坦克 ') # 设 置 窗口 标题 


tank image=pygame.image.1load('tankU.bmp') 
# 加 载 坦克 图 片 ， 返 回 一 个 surface 对 象 


tank rect=tank image.get rect() # 获 取 坦 克 图 片 的 区 域 形状 
while True: # 无 限 循环 
for event in pygame.event.get(): 
if event.type==pygame .QUIT: # 退 出 事件 处 理 


pygame .quit () 
sys.exit () 
# 使 坦克 移动 ， 速 度 由 speed 变量 控制 


tank rect=tank rect .move (Speed) 


# 当 坦克 运动 出 窗口 时 重新 设置 偏 移 量 

if(tank rect.left < 0) or (tank rect.right > width): # 水 平方 向 
speed[0]=-speed[0] # 水 平方 向 反 向 

if(tank rect.top < 0) or (tank rect.bottom > height) : 间 垂 直方 向 
speed[1]=-speed[1] # 垂 直方 向 反 向 

screen.fill (color black) # 填 充 窗 口 背景 

screen.blit (tank image, tank rect) # 在 窗口 指定 区 域 tank rect 上 绘制 坦克 

pygame .display.update () # 更 新 窗口 显示 内 容 

if _ name =='_ main _': 
Play _ tank() 





程序 运行 后 ， 可 以 看 到 白色 背景 的 游戏 窗口 ， 标 题 是 “自由 移动 的 坦克 ”， 如 图 17-3 
所 示 。 
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图 17-3 自由 移动 的 坦克 游戏 窗口 


在 该 游戏 中 通过 修改 坦克 图 像 (surface 对 象 ) 区域 的 left 属性 (可 以 认为 是 x 坐标 )、 
surface 对 象 的 top 属性 (可 以 认为 是 y 坐标 ) 改变 坦克 位 置 ， 从 而 显示 出 坦克 自由 移动 的 
效果 。 在 窗口 (窗口 也 是 surface 对 象 ) 使 用 的 blit0) 函 数 上 绘制 坦克 图 像 ， 最 后 注意 需要 
更 新 窗口 显示 内 容 。 

设置 fpsClock 变量 的 值 即 可 控制 游戏 速度 ， 语 法 如 下 : 

fpsClock=pygame .time.Clock() 


在 无 限 循环 中 写 入 fpsClock.tick(50)， 可 以 按 指 定 帧 频 50 更 新 游戏 画面 〈 即 每 秒 钟 刷 
新 50 次 屏幕 )。 

四 Pygame 的 图 形 绘制 

在 屏幕 上 绘制 各 种 图 形 时 使 用 pygame.draw 模块 中 的 一 些 函 数 ， 事 实 上 Pygame 可 以 
不 加 载 任何 图 片 ， 而 使 用 图 形 来 制作 一 个 游戏 。 

pygame.draw 中 函数 的 第 1 个 参数 总 是 一 个 surface， 然 后 是 颜色 ， 接 着 是 一 系列 的 坐 
标 等 。 对 于 计算 机 中 的 坐标 ，(0,0) 代 表 左 上 角 ， 水 平 向 右 为 X 轴 的 正方 向 ,垂直 向 下 为 Y 
轴 的 正方 向 。 该 函数 的 返回 值 是 一 个 rect 对 象 ， 包 含 了 绘制 的 区 域 ， 这 样 就 可 以 很 方便 地 
更 新 那个 部 分 了 。pygame.draw 中 的 函数 如 表 17-3 所 示 。 

表 17-3 pygame.draw 中 的 函数 


作 用 
lne0 
polygon0) 绘制 多 边 形 (3 个 及 3 个 以 上 的 边 ) 
circle() | 绘制 圆 
ellipse(O) | 绘制 椭圆 
绘制 圆 弧 























绘制 线 
绘制 一 系列 的 线 
绘制 一 根 平滑 的 线 

绘制 一 系列 平滑 的 线 














arc() 


下 面 详细 说 明 pygame.draw 中 各 个 函数 的 使 用 。 
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1 ) pygame.drawrect0 

格式 : pygame.draw.rect(surface, color,rect,width=0) 

pygame.draw.rect0 在 surface 上 画 一 个 和 矩形， 除了 surface 和 color 以 外 ，rect 接受 一 个 
矩形 的 坐标 和 线 宽 参数 ， 如 果 线 宽 是 0 或 省 略 ， 则 填充 。 

2) pygame.draw.polygon0 

格式 : pygame.draw.polygon(surface, color pointlist, width=0) 

polygon0 用 于 画 多 边 形 ， 其 用 法 类 似 于 rect0,， 与 rect0 的 第 1、 第 2、 第 4 个 参数 都 是 
相同 的 ， 只 不 过 polygon0 会 接受 一 系列 坐标 的 列表 ， 代 表 了 各 个 顶点 的 坐标 。 

3) pygame.draw.circle0 





格式 : pygame.draw.circle(surface, color pos, radius, width=0) 
circle0 用 于 画 一 个 圆 ， 它 接受 一 个 圆心 坐标 和 半径 参数 。 
4) pygame.draw.ellipseO 





格式 : pygame.draw.ellipse(surface, color, rect, width=0) 

用 户 可 以 把 ellipse 想象 成 一 个 被 压 扁 的 圆 ， 事 实 上 ， 它 可 以 被 一 个 矩形 装 起 来 。 
pygame.draw.ellipse0 的 第 3 个 参数 就 是 这 个 椭圆 的 外 接 和 矩形 。 

5) pygame.draw.arcO 

格式 : pygame.draw.arc(surface.colorrectstart_angle.stop_angle,width=1) 

arc 是 椭圆 的 一 部 分 ， 所 以 它 的 参数 比 椭圆 多 一 点 。 但 是 它 是 不 封闭 的 ， 因此 没有 fillo 
方法 。start_angle 和 stop_angle 为 开始 和 结束 的 角度 。 

6) pygame.draw.line() 

格式 : pygame.draw.line(surface,color,start_pos,end pos,width=1) 

line0 用 于 画 一 条 线段 ，start_ pos、end_pos 是 线段 起 点 和 终点 坐标 。 

7) pygame.draw.lines() 

格式 : pygame.draw.lines(surface,color,closed,pointlist,width=1) 


closed 是 一 个 布尔 变量 ， 指 明 是 否 需 要 多 画 一 条 线 来 使 这 些 线条 闭合 (这 样 就 和 


17.2.3 ”Pygame 的 键盘 和 鼠标 事件 的 处 理 


所 谓 事件 ， 就 是 程序 上 发 生 的 事 。 例 如 用 户 按 键盘 上 的 某 个 键 或 是 单 击 、 移 动 鼠 标 。 
对 于 这 些 事件 ， 游 戏 程序 需要 做 出 反应 。 在 例 17-2 中 ,程序 会 一 直 运 行 下 去 ， 直 到 用 户 关 
闭 窗口 而 产生 了 一 个 QUIT 事件 ，Pygame 会 接收 用 户 的 各 种 操作 (例如 按键 盘 上 的 键 、 移 
动 鼠 标 等 ) 产生 事件 。 事件 随时 可 能 发 生 , 而 且 量 可 能 会 很 大 ，Pygame 的 做 法 是 把 一 系列 
事件 存放 到 一 个 队列 里 逐个 处 理 。 

在 例 17-2 中 使 用 了 pygame.event.get() 来 处 理 所 有 事件 , 如 果 使 用 pygame.event.wait()， 
Pygame 会 等 到 发 生 一 个 事件 时 才 继 续 下 去 , 一般 在 游戏 中 不 太 实用 , 因为 游戏 往往 是 需要 
动态 运作 的 。Pygame 中 的 常用 事件 如 表 17-4 所 示 。 
































| 314 





第 17 章 基于 Pygame 的 游戏 设计 1 gt 


表 17-4 Pygame 中 的 常用 事件 

















事 件 产生 途径 参数 
QUIT 用 户 按 下 “关闭 ”按钮 none 
ACTIVEEVENT gain、state 
KEYDOWN 键盘 被 按 下 unicode、key、mod 
KEYUP 键盘 被 放 开 key、mod 
MOUSEMOTION 鼠标 移动 pos、 rel、buttons 
MOUSEBUTTONDOWN 鼠标 被 按 下 pos、button 
MOUSEBUTTONUP 鼠标 被 放 开 pos、 button 





@ Pygame 的 键盘 事件 的 处 理 

通常 用 pygame.event.get() 获 取 所 有 事件 ， 若 event.type 一 KEYDOWN， 这 时 是 键盘 事 
件 ， 再 判断 按键 event.key 的 种 类 ( 即 K_a、K_b、K_LEFT 这 种 形式 )。 用 户 也 可 以 使 用 
pygame.key.get_pressed() 获 取 所 有 被 按 下 的 键 值 , 它 会 返回 一 个 元 组 。 这 个 元 组 的 索引 就 是 
键 值 ， 对 应 的 就 是 键 是 否 被 按 下 。 

pressed keys=pygame .key.get pressed() 

if pressed keys [K SPRCE] : 


# 空 格 键 被 按 下 
fire()# 发 射 子弹 


在 key 模块 下 有 很 多 函数 。 

。 key.get focused0: 返回 当前 的 Pygame 窗口 是 否 被 激活 。 

。 key.get pressed0: 获得 所 有 按 下 的 键 值 。 

。 key.get mods0: 按 下 的 组 合 键 (Alt、Ctrl、Shift)。 

。 key.set_mods0: 模拟 按 下 组 合 键 的 效果 (KMOD _ ALT、KMOD CTRL、KMOD_ 

SHIFT)。 

贺 173 使 用 Pygame 开发 一 个 由 用 户 控 制 坦克 移动 的 游戏 。 在 例 17-2 的 基础 上 
增加 通过 方向 键 控制 坦克 运动 的 功能 ， 并 为 游戏 增加 背景 图 片 。 程 序 的 运行 效果 如 图 17-4 
所 示 。 

import os 

import sys 

import pygame 

from pygame.locals import * 


def control tank (event): # 控 制 坦克 运动 函数 
speed=[x,y]=[0, 0] # 相 对 坐标 
Speed offset=1 # 速 度 


# 当 方向 键 被 按 下 时 进行 位 置 计算 
if event .type==pygame .KEYDOWN: 
if event.key==pygame.K LEFT: 
speed[0] -=speed offset 
if event.key==pygame.K RIGHT: 
speed[0]=speed offset 
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if event .key==pYygame.K_UP: 
speed[1] -=speed offset 
if event.key==pygame.K DOWN: 
speed[1]=speed offset 
# 当 方向 键 被 释放 时 相对 偏 移 为 0， 即 不 移动 
if event.type in (pygame.KEYUP, pygame.K LEFT, pygame.K RIGHT, pygame 
-K DOWN) 
speed=[0, 0] 
return speed 
def Play tank(): 
pygame.init () 


window size=Rect (0, 0, 600, 400) # 窗 口 大 小 
Specg= iol # 坦 克 运行 偏 移 量 ， 即 [水 平 , 垂直 ] ， 值 越 大 ， 移 动 越 快 
color black=(255，255，255) # 窗 口 背 景色 RGB 值 〈 白 色 ) 


screen=pygame.display.set mode (window size.size) 坦 设 置 窗口 模式 
pygame.display.set caption(' 用 户 方向 键 控制 坦克 移动 ') ” #i 设 置 窗口 标题 


tank image=pygame.image.1load('tankU.bmp') # 加 载 坦克 图 片 
# 加 载 窗口 背景 图 片 
back image=pygame.image.load('back image.jpg') 
tank rect=tank image.get rect() # 获 取 坦 克 图 片 的 区 域 形状 
while True: 
# 退 出 事件 处 理 
for event in pygame.event.get(): #pygame .event .get () 获取 事件 序列 


if event.type==pygame .QUIT: 
pygame .quit () 
sys.exit () 
# 使 坦克 移动 ， 速 度 由 speed 变量 控制 
cur speed=control tank (event) 
#rect 的 clamp () 方法 使 移动 范围 限制 在 窗口 内 


tank rect=tank rect.move (CUT speed) .clamp (window size) 


screen.blit (back image, (0, 0)) # 设 置 窗口 背景 图 片 
screen.blit (tank image,tank rect) # 在 窗口 上 绘制 坦克 
Pygame.display.update() # 更 新 窗口 显示 内 容 
if _name =='_ main _': 
play_tank() 


当 用 户 按 下 方向 键 ， 计 算出 相对 位 置 cur_speed 后 ， 使 用 tank _rectmove(cur_speed) 函 
数 向 指定 方向 移动 坦克 。 当 释放 方向 键 时 坦克 停止 移动 。 
四 Pygame 的 鼠标 事件 的 处 理 
pygame.mouse 的 函数 如 下 。 
。 pygame.mouse.get_pressed(): 返回 按键 的 按 下 情况 ,返回 的 是 一 元 组 ， 分 别 为 左 键 、 
中 键 、 右 键 ， 如 果 被 按 下 则 为 True。 








| 316 





第 17 章 基于 Pygame 的 游戏 设计 | WwW/ 








图 17-4 用 方向 键 控制 坦克 运动 的 游戏 窗口 


。 pygame.mouse.get rel0: 返回 相对 偏 移 量 ， 即 (x 方向 偏 移 量 ，y 方向 偏 移 量 ) 的 一 
元 组 。 

。 pygame.mouse.get_pos(): 返回 当前 鼠标 位 置 (x, y)。 

例如 “x, y= pygame.mouse.get_pos()” 用 于 获取 鼠标 位 置 。 

。 pygame.mouse.set_pos(): 设置 鼠标 位 置 。 

。 pygame.mouse.set_visible(): 设置 鼠标 光标 是 否 可 见 。 

。 pygame.mouse.get_focused(): 如 果 鼠 标 在 Pygame 窗口 内 有 效 ， 返 回 True。 

。 pygame.mouse.set_cursor(): 设置 鼠标 的 默认 光标 样式 。 

。 pygame.mouse.get_cursor(): 返回 鼠标 的 光标 样式 。 

[ 贺 17-4 演示 鼠标 事件 处 理 的 程序 ， 运 行 效果 如 图 17-5 所 示 。 


import pygame 
from pygame.locals import * 








from sys import exit 
from random import * 
from math import pi 
pygame.init () 
screen=pygame.display.set mode((640, 480), 0, 32) 
points=[] 
while True: 
for event in pygame.event.get(): 
if event .type==QUIT: 
pygame.quit () 
exit() 
if event .type==KEYDOWN: 
# 按 任意 键 可 以 清 屏 ， 并 把 点 回复 到 原始 状态 


points=[] 
screen.fill((255,255,255)) # 用 白色 填充 窗口 背景 
if event -type==MOUSEBUTTONDOWN : # 鼠 标 按 下 
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screen- tilL((255;255,255)) 
# 画 随机 逢 形 
re=(255.0.0) 坦 红 色 
rp=(randint (0,639), randint (0,479) ) 
rs=(639-randint (rp[0],639),479-randint (rp[1],479)) 
pygame.draw.rect (screen, rc,Rect (rp,rs)) 
# 画 随机 圆 形 
rc=(0,255, 0) # 绿 色 
rp= (randint (0,639), randint (0,479)) 
rr=randint (1,200) 
pygame .draw.circle (screen,rc, rp,rr) 
# 获 得 当前 鼠标 单 击 位 置 
Xx, y=pygame .mouse.get pos() 
points.append ( (x,y)) 
# 根 据 单 击 位 置 画 弧 线 
angle= (x/639.)*pi*2. 
pygame.draw.arc(screen, (0,0,0), (0,0,639,479),0,angle, 3) 
# 根 据 单 击 位 置 画 椭圆 
pygame .draw.ellipse (screen, (0,255,0), (0,0,x,y)) 
# 从 左上 和 右 下 画 两 根 线 连接 到 单 击 位 置 
pygame .draw.line (screen, (0,0,255), (0,0), (x,y)) 
pygame.draw.line (screen, (255,0,0), (640,480), (x, y)) 
# 画 单 击 轨迹 图 
if len(points)>1: 
pygame .draw.1lines (screen, (155,155,0),False,points,2) 
# 和 轨迹 图 基本 一 样 ， 只 不 过 是 闭合 的 ， 因 为 会 覆盖 ， 所 以 这 里 注释 了 
#if len (Points) >=3: 
# pygame.draw.polygon(screen, (0,155,155),points,2) 
# 把 每 个 点 画 明 显 一 点 
for'p in points: 
pygame.draw.circle(screen, (155,155,155),p, 3) 


pygame.display.update() 





do I 
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图 17-5 演示 鼠标 事件 处 理 的 程序 的 运行 效果 





运行 这 个 程序 ， 在 窗口 上 单 击 鼠 标 就 会 有 图 形 出 来 ， 按 任意 键 可 以 重新 开始 。 





第 17 章 基于 Pygame 的 游戏 设计 1 了 


17.2.4 ”Pygame 的 字体 使 用 


Pygame 可 以 直接 调用 系统 字体 ， 也 可 以 调用 TTF 字体 。 为 了 使 用 字体 ， 首 先 应 该 创 
建 一 个 Font 对 象 ， 对 于 系统 自 带 的 字体 应 该 这 样 调用 : 


fontl=pygame.font.SysFont ('arial', 16) 


第 1 个 参数 是 字体 名 ， 第 2 个 参数 是 字号 。 在 正常 情况 下 系统 里 都 会 有 arial 字体 ， 如 
果 没 有 会 使 用 默认 字体 ， 默 认 字 体 和 用 户 使 用 的 系统 有 关 。 
用 户 可 以 使 用 pygame.font.get_fonts() 来 获取 当前 系统 所 有 的 可 用 字体 : 


>>> pygame.font.get fonts() 





'gisha', 'fzshuti', 'simsunnsimsun', 'estrangeloedessa', 
'symboltigerexpert', 'juiceitc', 'onyx', 'tiger', 'webdings', 
'franklingothicmediumcond', "edwardianscriptitc'" 


另外 还 有 一 种 调用 方法 是 使 用 自己 的 TTF 字体 : 

my_font=pygame .font .Font ("my font.ttf", 16) 

这 个 方法 的 好 处 是 可 以 把 字体 文件 和 游戏 一 起 打包 分 发 ， 避 免 玩 家 计算 机 上 没有 这 个 
字体 而 无 法 显示 的 问题 。 一 旦 有 了 Font 对 象 ， 就 可 以 用 render() 方 法 来 设置 文字 内 容 ， 然 
后 通过 blit0 方 法 写 到 屏幕 上 : 

text=font1.render ("坦克 大 战 "，, True, (0,0,0)，, (255,255,255)) 

render() 方 法 的 第 1 个 参数 是 写 入 的 文字 内 容 , 第 2 个 参数 是 布尔 值 ， 说 明 是 否 开启 抗 
锯齿 第 3 个 参数 是 字体 本 身 的 颜色 ;第 4 个 参数 是 背景 的 颜色 。 如 果 不 想 有 背景 色 ， 也 
就 是 让 背景 透明 ， 可 以 不 加 第 4 个 参数 。 

例如 自己 定义 一 个 文字 处 理 函 数 show_text0, 其 中 参数 surface_handle 为 surface 句柄 ， 
pos 为 文字 显示 位 置 , color 为 文字 颜色 , font_ bold 为 是 否 加 粗 , font_size 为 字体 大 小 , font_ 
italic 为 是 否 斜体 。 


def show text (surface handle, pos, text, color, font bold=False, font 





size=13, font italic=False): 
#cur_ font=pygame.font.SysFont ("宋体 ",，font size) # 获 取 系 统 字体 
cur font=pygame.font.Font ('simfang.ttf'，30) ， 间 获 取 字体 ， 并 设置 文字 大 小 


cur font.set bold(font bold) # 设 置 是 否 加 粗 
cur font.set italic(font italic) # 设 置 是 否 斜体 
text fmt=cur font.render(text, 1, color) # 设 置 文字 内 容 
surface handle.blit (text fmt, pos) # 绘 制 文字 




















在 更 新 窗口 内 容 pygame.displayupdate0) 之 前 加 入 : 


text_pos=u "坦克 大 战 " 
show text (screen, (20, 220), text pos, (255, 0, 0), True) 
text_pos=u" 坦 克 位 置 : (%d,%d)" $$ (tank rect.left, tank rect.top) 
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Show text(screeny (20 420) 7 text posy (0 255, 255), True) 


此 时 会 在 屏幕 上 的 (20, 220) 处 显示 红色 的 “坦克 大 战 ”文字 ,并 且 在 (20, 420) 处 显示 现 
在 坦克 所 处 位 置 的 坐标 ， 移 动 坦克 ， 位 置 坐标 文字 同时 会 改变 。 


17.2.5 ”Pygame 的 声音 播放 


@ Sound 对 象 

在 初始 化 声音 设备 后 就 可 以 读 取 一 个 音乐 文件 到 一 个 Sound 对 象 中 。pygame.mixer 
-Sound() 接 受 一 个 文件 名 ， 也 可 以 是 一 个 文件 对 象 ， 不 过 这 个 文件 必须 是 WAV 或 者 OGG 
文件 。 


hello sound=pygame.mixer.sound ("hello.o0gg") ## 建 立 Sound 对 象 
hello sound.play() # 声 音 播放 一 次 


一 旦 这 个 Sound 对 象 出 来 了 ， 就 可 以 使 用 play0 来 播放 它 。play(loop, maxtime) 可 以 接 
受 两 个 参数 ，loop 是 重复 的 次 数 〈 取 1 是 两 次 ， 注 意 是 重复 的 次 数 而 不 是 播放 的 次 数 )， 
-1 意味 着 无 限 循环 ，maxtime 是 指 多 少 毫秒 后 结束 。 

若 不 使 用 任何 参数 调用 ， 意 味 着 把 这 个 声音 播放 一 次 。 一 旦 play() 方 法 调用 成 功 ， 就 
会 返回 一 个 Channel 对 象 ， 否 则 返回 一 个 None。 

四 music 对 象 

在 Pygame 中 还 提供 了 pygame.mixer.music 类 来 控制 背景 音乐 的 播放 。pygame 
.mixer.music 用 来 播放 MP3 和 OGG 音乐 文件 ,不 过 MP3 并 不 是 所 有 的 系统 都 支持 (Linux 
默认 就 不 支持 MP3 播放 )。 用 户 可 以 用 pygame.mixer.music.load() 加 载 一 个 文件 ， 然 后 使 用 
pygame.mixer.music.play0) 播 放 ， 不 放 的 时 候 就 用 stop0 方 法 停止 ， 当 然 也 有 类 似 录 影 机 上 
的 pause0 和 unpause() 方 法 。 

# 载 痛 景 音乐 


pygame .mixer.music.load("hello.mp3") 

















pygame .mixer.music.set volume (music volume/100.0) 
# 循 环 播放 ， 从 音乐 的 第 30 秒 开 始 

pygame .mixer.music.play(-1, 30.0) 

在 游戏 退出 事件 中 加 入 停止 音乐 播放 的 代码 : 

# 停 止 音乐 播放 

pygame .mixer.music.stop() 

music 对 象 提供 了 丰富 的 函数 方法 ， 下 面 分 别 介绍 。 

1 ) pygame.mixer.music.load() 

功能 : 加 载 音 乐 文件 。 


格式 : pygame.mixermusic.load(filename) 





2) pygame.mixer.music.play() 


功能 : 播放 音乐 。 
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格式 : pygame.mixer.music.play(loops=0,start=0.0) 
其 中 ，loops 表示 循环 次 数 ， 如 果 设 置 为 -1， 表 示 不 停 地 循环 播放 ， 如 果 loops 为 5， 则 播 
放 5+1=6 次 ; start 参数 表示 从 音乐 文件 的 哪 一 秒 开始 播放 ， 设 置 为 0 表示 从 开始 完整 
播放 。 

3) pygame.mixer.music.rewind() 

功能 : 重新 播放 。 

格式 : pygame.mixer.music.rewind() 

4) pygame.mixer.music.stop() 

功能 : 停止 播放 。 

格式 : pygame.mixer.music.stop() 

5) pygame.mixer.music.pause() 

功能 : 暂停 播放 。 

格式 : pygame.mixer.music.pause() 

用 户 可 通过 pygame.mixer.music.unpause() 恢 复 播放 。 

6) pygame.mixer.music.set_volume() 

功能 : 设置 音量 。 

格式 : pygame.mixermusic.set volume(value) 
其 中 ，value 的 取 值 为 0.0 一 1.0。 

7) pygame.mixer.music.get_pos() 

功能 :获取 当前 播放 了 多 长 时 间 。 


格式 : pygame.mixer.music.get_pos(): retur time 


17.2.6 ”Pygame 的 精灵 使 用 


pygame.sprite.Sprite 是 Pygame 中 用 来 实现 精灵 的 一 个 类 , 在 使 用 时 并 不 需要 对 它 实 例 
化 ， 只 需要 继承 它 ， 然 后 按 需 写 出 自己 的 类 ， 因 此 非常 简单 、 实 用 。 

@ 精灵 

精灵 可 以 被 认为 是 一 个 个 小 图 片 ( 帧 序列 (例如 入 物 行走 )， 它 可 以 在 屏幕 上 移动 ， 
并 且 可 以 与 其 他 图 形 对 象 交 互 。 精 灵图 像 可 以 是 使 用 Pygame 绘制 形状 函数 绘制 的 形状 ， 
也 可 以 是 图 像 文件 。 图 17-6 所 示 为 由 16 帧 图 片 组 成 的 人 物 行走 序列 。 

@ Sprite 类 的 成 员 

pygame.sprite.Sprite 用 来 实现 精灵 类 ，Sprite 的 数据 成 员 和 函数 方法 主要 如 下 。 

1) selfimage 

其 负责 显示 什么 图 形 ， 例 如 selfimage=pygame.Surface([x.y]) 说 明 该 精灵 是 一 个 xxy 大 
小 的 矩形 ，selfimage=pygame.image.load(filename) 说 明 该 精灵 显示 flename 这 个 图 片 文件 。 

selfimage.fill([color]) 负 责 对 selfimage 着 色 ， 例 如 : 


























self.image=pygame.Surface([x,y]) 
self.image.fill([255,0,0]) # 对 xxy 大 小 的 矩形 填充 红色 
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图 17-6 精灵 图 片 序列 


2) selfrect 

其 负责 在 哪里 显示 ,一 般 来 说 , 先 用 self.rect=selfimage.get_rect() 获 取 image 矩形 大 小 ， 
然后 给 selfrect 设 定 显示 的 位 置 ， 一般 用 selfrect.topleft 确定 左上 角 的 显示 位 置 ， 当 然 也 可 
以 用 topright、bottomright、bottomleft 分 别 确定 其 他 几 个 角 的 位 置 。 

另外 ，selfrecttop、selfrectbottom、selfrectleft、selfrectright 分 别 表示 上 、 下 、 左 、 右 。 

3) self.update() 

其 负责 使 精灵 行为 生效 。 

4) Sprite.add() 

添加 精灵 到 groups 中 。 

5) Sprite.remove() 

从 精灵 组 groups 中 删除 。 

6) Sprite.kill() 

从 精灵 组 groups 中 删除 全 部 精灵 。 

7) Sprite.alive() 

判断 某 个 精灵 是 否 属于 精灵 组 groups。 

@ 建立 精灵 

所 有 精灵 在 建立 时 都 是 从 pygame.sprite.Sprite 中 继承 的 , 建立 精灵 要 设计 自己 的 精灵 类 。 

[ 贺 17-5 建立 Tank 精灵 。 

















import pygame,sys 
pygame .init() 
class Tank (pygame.sprite.Ssprite): 
def _ init _ (self,filename,initial position): 
pygame.sprite.Ssprite. init _(self) 
self.image=pygame.image.load (filename) 
self.rect=self.image.get rect() # 获 取 self .image 的 大 小 
#5self.rect.topleft=initial position # 确 定 左 上 角 的 显示 位 置 
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self.rect.bottomright=initial position 


screen=pygame.display.set mode([640,480]) 
screen.fill([255,255,255]) 
fi="'tankU .jpg"' 
b=Tank (fi, [150,100]) 
while True: 
for event in pygame .event.get() : 
if event .type==pygame .QUIT : 
sys.exit () 
screen.blit (b.image,b.rect) 
pygame.display.update() 


[ 贺 17-6 使 
在 游戏 动画 中 ， 人 物 行走 是 基本 动画 ， 
画 的 效果 。 














import pygame 

from pygame.locals import * 

class MySprite (pygame.sprite.sprite): 
def _ init (self, target): 

pygame.sprite.Sprite. init _(self) 

self.target surface=target 

self.image=None 

self.master image=None 

self.rect=None 

self.topleft=0,0 

self.frame=0 

self.old frame=-1 

self.frame width=1 

self.frame height=1 
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# 右 下 角 的 显示 位 置 是 [150, 100] 


图 17-6 所 示 的 精灵 图 片 序列 建立 动画 效果 的 人 物 行走 精灵 。 
在 精灵 中 不 断 切换 人 物 行走 图 片 ， 从 而 达到 动 


self.first_frame=0 # 第 1 帧 序号 
self.last frame=0 # 最 后 一 帧 序号 
self.columns=1 # 列 数 


self.last time=0 


在 加 载 一 个 精灵 图 
文件 名 和 列 数 )。 





片 序列 的 时 候 需 要 告知 程序 一 帧 的 大 小 《 传 入 帧 的 宽度 和 高 度 以 及 


def load(self, filename, width, height, columns): 


self.master image=pygame.image.load (filename) .convert alpha() 


self.frame width=width 
self.frame height=height 
self.rect=0,0,width,height 
self.columns=columns 


rect=self. master image -get rect() 
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self.last frame=(rect.width//width)*(rect.height//height)-1 
一 个 循环 动画 通常 是 这 样 工 作 的 : 从 第 1 帧 开始 不 断 地 加 载 直到 最 后 一 帧 ， 然 后 再 返 
回 第 1 帧 ， 并 不 断 重复 这 个 操作 。 
但 是 如 果 只 是 这 样 做 ， 程 序 会 一 股 脑 地 将 动画 播放 完 ， 这 里 想 让 它 根据 时 间 间 隔 一 张 
一 张 地 播放 ， 因 此 加 入 定时 的 代码 ， 将 帧 速率 ticks 传递 给 Sprite 的 update0) 函 数 ， 这 样 就 
可 以 轻松 地 让 动画 按照 帧 速率 来 播放 。 
def update(self, current time, rate=60): 
if current time>self.last time + rate: # 如 果 时 间 超过 上 次 时 间 +60 毫秒 








self.frame+=1 # 帧 号 加 1， 意 味 着 显示 下 一 帧 图 像 
if self.frame>self.last frame: # 帧 号 超过 最 后 一 帧 
Self.frame=self.first frame # 回 到 第 1 帧 


self.last time=current time 

if self.frame!=self.old frame: 
# 首 先 需 要 计算 单个 帧 左上 角 的 x、y 位 置 值 
frame x=(self.frame 当 self.columns) * self.frame width 
frame y=(self.frame // self.columns) * self.frame height 
# 然 后 将 计算 好 的 x, y 值 传递 给 位 置 属性 


rect=(frame x, frame y, self.frame width, self.frame height) 


# 要 显示 区 域 
self.image=self.master image.subsurface (rect) 
# 截 取 要 显示 区 域 图 像 


self.old frame=self .frame 
pygame .init() 
Screen=pygame .display.set mode((800,600),0,32) 
pygame.display.set caption (" 精 灵 类 测试 ") 
font=pygame . font .Font (None, 18) 
# 启 动 一 个 定时 器 ， 然 后 调用 tick (num) 函数 就 可 以 让 游戏 以 num 帧 来 运行 
framerate=pygame .time.Clock() 
cat=MySprite (screen) 
cat.load("sprite2.png", 92, 95, 4) # 精 灵图 片 ， 每 帧 92x95 大 小 ， 共 4 列 
group=pygame .sprite.Group() 
group.add (cat) 
while True: 
framerate.tick(10) # 指 定 帧 速率 
ticks=pygame.time.get ticks() # 获 取 运 行 时 间 
for event in pygame.event.get(): 
if event .type==pygame .QUIT: 
pygame.quit () 


exit () 

key=pygame .key.get pressed() 

if key[pygame.K ESCAPE]: #Esc 键 
exit () 
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Screen-fil1((0,0,100)) 

#cat .draw(screen) # 没 有 此 方法 
cat.update (ticks) 

screen.blit (cat.image, cat.rect) 

#group.update (ticks) 

#group.draw (screen) 

pygame.display.update() 


运行 后 可 见 一 个 人 物 行走 动画 , 用 户 也 可 以 使 用 精灵 组 的 update0 和 draw0 函 数 实现 精灵 
动画 。 
group .update (ticks) 
# 将 帧 速率 ticks 传递 给 sprite 的 update () 函数 ， 让 动画 按照 帧 速率 来 播放 


group .draw(Sscreen) 

@ 建立 精灵 组 

当 程 序 中 有 大 量 实体 的 时 候 ， 操 作 这 些 实体 将 会 是 一 件 相当 麻烦 的 事 ， 那 么 有 没有 什 
么 容器 可 以 将 这 些 精 灵 放 在 一 起 统一 管理 呢 ? 答案 就 是 使 用 精灵 组 。 

Pygame 使 用 精灵 组 来 管理 精灵 的 绘制 和 更 新 ， 精 灵 组 是 一 个 简单 的 容器 。 

使 用 pygame.sprite.Group() 函 数 可 以 创建 一 个 精灵 组 : 


group=pygame .sprite.Group() 
































group.add (sprite one) 
精灵 组 也 有 update0 和 draw0) 函 数 : 


group.update () 
group .draw() 


Pygame 还 提供 了 精灵 与 精灵 之 间 的 冲突 检测 、 精 灵 与 组 之 间 的 碰撞 检测 , 这 些 碰撞 检 
测 技术 在 17.4 节 的 飞机 大 战 游戏 中 要 使 用 。 

人 @ 精灵 与 精灵 之 间 的 碰撞 检测 

1) 两 个 精灵 之 间 的 矩形 检测 

在 只 有 两 个 精灵 的 时 候 可 以 使 用 pygame.sprite.collide_rect() 函 数 进行 一 对 一 的 冲突 检 
测 。 这 个 函数 需要 传递 两 个 精灵 ， 并 且 每 个 精灵 都 需要 继承 自 pygame.sprite.Sprite。 

这 里 举 个 例子 : 

spirte 1=MySprite ("sprite 1.png",200,200,1) 

#MySprite 是 例 17-6 创建 的 精灵 类 
sprite 2=MySprite("sprite 2.png",50,50,1) 
result=pygame.sprite.collide rect(sprite 1,sprite 2) 


if result: 


print ("精灵 碰撞 上 了 ") 

2) 两 个 精灵 之 间 的 圆 检 测 
和 矩形 冲突 检测 并 不 适用 于 所 有 形状 的 精灵 , 因此 在 Pygame 中 还 提供 了 圆 形 冲突 检测 。 
pygame.sprite.collide_circle() 函 数 是 基于 每 个 精灵 的 半径 值 来 进行 检测 的 ， 用 户 可 以 自己 指 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 
定 精灵 半径 ， 或 者 让 函数 计算 精灵 半径 。 
result=pygame.sprite.collide circle (sprite 1,sprite 2) 
if result: 
print ("精灵 碰撞 上 了 ") 
3) 两 个 精灵 之 间 的 像素 遮 罩 检测 
如 果 矩 形 检测 和 圆 形 检测 都 不 能 满足 需求 ,Pygame 还 为 用 户 提供 了 一 个 更 加 精确 的 检 
测 一 一 pygame.sprite.collide_ mask()。 
这 个 函数 接受 两 个 精灵 作为 参数 ， 返 回 值 是 一 个 bool 变量 。 
if pygame.sprite.collide mask(sprite 1,sprite 2): 
print ("精灵 碰撞 上 了 ") 
4) 精灵 和 组 之 间 的 矩形 冲突 检测 
在 调用 pygame.sprite.spritecollide(sprite.sprite_group.booD) 函 数 的 时 候 , 一 个 组 中 的 所 有 
精灵 都 会 逐个 地 对 另外 一 个 单个 精灵 进行 冲突 检测 ,发 生 冲 突 的 精灵 会 作为 一 个 列表 返回 。 
这 个 函数 的 第 1 个 参数 是 单个 精灵 ， 第 2 个 参数 是 精灵 组 ， 第 3 个 参数 是 一 个 bool 
值 ， 最 后 这 个 参数 起 了 很 大 的 作用 ， 当 为 True 的 时 候 会 删除 组 中 所 有 冲突 的 精灵 ， 当 为 
False 的 时 候 不 会 删除 冲突 的 精灵 。 


list collide=pygame.sprite.spritecollide (sprite, sprite group,False); 


另外 ， 这 个 函数 还 有 一 个 变 体 一 pygame.sprite.spritecollideany()， 这 个 函数 在 判断 精 
灵 组 和 单个 精灵 冲突 的 时 候 会 返回 一 个 bool 值 。 
5) 精灵 组 之 间 的 矩形 冲突 检测 
利用 pygame.sprite.groupcollide() 函 数 可 以 检测 两 个 组 之 间 的 冲突 , 它 返回 一 个 字典 ( 键 
值 对 )。 

以 上 学 习 了 几 种 常用 的 冲突 检测 函数 ， 下 面 在 游戏 实例 中 实际 运用 这 些 函数 。 








人 


贪 吃 蛇 游戏 通过 玩家 控制 蛇 移 动 ， 不 断 吃 到 食物 〈 红 色 草 莓 ) 增长 ， 直 到 蛇 身 碰 到 边 
界 游戏 结束 。 其 运行 效果 如 图 17-7 所 示 。 


import pygame, sys, time, random 
from pygame.locals import * 


输入 下 面 的 两 行 来 启用 Pygame， 这 样 Pygame 在 该 程序 中 就 可 以 用 了 : 


pygame .init() 





fpsClock=pygame .time.Clock() 


第 1 行 告诉 Pygame 初始 化 ， 第 2 行 创建 一 个 名 为 fpsClock 的 变量 ， 该 变量 用 来 控制 
游戏 的 速度 。 然 后 用 下 面 的 两 行 代码 新 建 一 个 Pygame 显示 层 〈 游 戏 元 素 画 布 )。 
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图 17-7 基于 Pygame 设计 的 贪 吃 蛇 游 戏 的 运行 效果 
playSurface=pygame.display.set mode((640, 480)) 


pygame .display.set caption('Raspberry Snake') 


接 下 来 定义 色 ， 虽 然 这 一 步 并 不 是 必需 的 ， 但 它 会 减少 代码 
义 了 程序 中 用 到 的 颜色 : 


redColour=pygame.Color (255, 0, 0) 


圭 。 下 面 的 代码 定 


blackColour=pygame.-Color(0，0，0) 
whiteColour=pygame.Color (255, 255, 255) 
greyColour=pygame .Color (150, 150, 150) 


下 面 的 几 行 代码 初始 化 了 程序 中 用 到 的 一 些 变量 ， 这 是 很 重要 的 一 步 ， 因 为 如 果 游 戏 
开始 时 这 些 变量 为 空 ，Python 将 无 法 正常 运行 。 


snakePosition=[100,100] # 蛇 头 位 置 
snakeSegments=[[100,100], [80,100], [60,100]] # 蛇 身 序列 
raspberryPosition=[300,300] # 草 莓 位 置 
raspberrySpawned=1 # 是 否 吃 到 草莓 ，1 为 没有 吃 到 ，0 为 吃 到 
direction='right' # 运 动 方向 ， 初 始 向 右 


changeDirection=direction 

此 时 可 以 看 到 变量 snakePosition、snakeSegments 和 raspberryPosition 被 设置 为 用 逗号 
分 隔 的 列表 。 

用 下 面 几 行 代码 来 定义 gameOver() 函 数 : 

def gameOver () : 


gameOverFont=pygame .font .Font ('freesansbold.ttf"', 72) 


gameOverSurf=gameOVverFont .render ("Game Over', True, greyColour) 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 


gameOverRect=gameOverSurf.get rect () 


gameOverRect .midtop=(320，10) 


playSurface.blit (gameOverSurf, gameOverRect) 


pygame.display.flip() 
time.sleep (5) 

pygame .quit () 
sys.exit () 


gameOver() 函 数 用 了 一 些 Pygame 命令 来 完成 一 个 简单 的 任务 : 用 大 号 字体 将 Game 


Over 打印 在 屏幕 上 ， 停 








享 留 5 秒 钟 ， 然 后 退出 Pygame 和 Python 程序 。 在 游戏 开始 之 前 就 定 





义 了 结束 函数 ， 这 看 起 来 有 点 奇怪 ， 但 是 所 有 的 函数 都 应 该 在 被 调用 前 定义 。Python 是 不 
会 自己 执行 gameOver() 函 数 的 ， 直 到 用 户 调用 该 函数 。 

至 此 程序 的 开头 部 分 已 经 完成 , 接 下 来 进入 主要 部 分 。 该 程序 运行 在 一 个 无 限 循环 (一 
个 永 不 退出 的 while 循环 ) 中 ， 直 到 蛇 撞 到 了 墙 或 者 自己 才 会 结束 游戏 。 首 先 用 下 面 的 代 


码 开始 主 循环 : 


while True: 














没有 其 他 的 比较 条 件 ，Python 会 检测 True 是 否 为 真 。 如 果 True 一 直 为 真 ， 循 环 会 一 
直 进 行 ， 直 到 用 户 调用 gameOverO 函 数 告诉 Python 退出 该 循环 。 


for event in pygame .event .get() : 





if event .type==QUIT: 
pygame.quit () 
sys.exit () 
elif event .type==KEYDOWN: 
elif event .type==KEYDOWN: 
if event.key==K RIGHT or event.key==ord('d'): 


changeDirection="'right' 


if event.key==K LEFT or event.key==ord('a') : 


changeDirection='left'" 


if event .key==K UP or event.key==ord('w') : 


changeDirection='up'" 


if event .key==K DOWN or event.key==ord('s') : 


changeDirection='down'" 
if event .key==K ESCAPE: 
pygame .event .post (pygame .event .Event (QUIT) ) 


for 循环 用 来 检测 按键 等 Pygame 事件 。 
第 1 个 检测 让 eventtype 一 QUIT 告诉 Python 如 果 Pygame 发 出 了 QUIT 信息 ( 当 用 户 
按 下 Esc 键 时 )， 执 行 下 面 缩 进 的 代码 。 之 后 的 两 行 类 似 gameOver0 函 数 ， 通 知 Pygame 和 





Python 程序 结束 并 退 昌 








H 
Do 


第 2 个 检测 以 elf 开头 的 行 用 来 检测 Pygame 是 否 发 出 KEYDOWN 事件 ,该 事件 在 用 


户 按 下 键盘 时 产生 。 
KEYDOWN 事件 
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本 例 中 提供 了 两 种 控制 蛇 的 方法 ， 即 用 鼠标 或 者 键盘 上 的 W、D、A、S 键 让 蛇 向 上 、 右 、 
下 、 左 移动 。 程 序 开始 时 ， 蛇 会 按照 changeDirection 预 设 的 值 向 右 移 动 ， 直 到 用 户 按 下 键 
盘 改变 其 方向 。 

在 程序 开始 的 初始 化 部 分 有 一 个 叫 direction 的 变量 , 这 个 变量 协同 changeDirection 检 
测 用 户 发 出 的 命令 是 否 有 效 。 蛇 不 应 该 立即 向 后 运动 (如 果 发 生 该 情况 ， 蛇 会 死亡 ， 同 时 
游戏 结束 )。 为 了 防止 这 样 的 情况 发 生 ， 将 用 户 发 出 的 请 求 〈 保 存在 changeDirection 里 ) 
和 目前 的 方向 (保存 在 direction 里 ) 进行 比较 ， 如 果 方 向 相反 ， 忽 略 该 命令 ， 蛇 会 继续 按 
原 方向 运动 。 这 里 用 下 面 几 行 代码 进行 比较 : 


if changeDirection=="'right' and not direction=='left': 












































direction=changeDirection 

if changeDirection=="'left' and not direction=='right': 
direction=changeDirection 

if changeDirection=='up' and not direction=='down' : 
direction=changeDirection 

if changeDirection=='down' and not direction=='up': 
direction=changeDirection 


这 样 就 保证 了 用 户 输入 的 合法 性 ， 蛇 〈 在 屏幕 上 显示 为 一 系列 块 ) 就 能 够 按照 用 户 的 
输入 移动 。 每 次 转弯 时 ， 蛇 都 会 向 该 方向 移动 一 小 节 。 每 个 小 节 为 20 像素 ,用户 可 以 告诉 
Pygame 在 任何 方向 移动 一 小 节 。 


if direction=='right': 

















snakePosition[0]+=20 
if direction=='1left' : 
snakePosition[0] -=20 
if direction=='up': 
snakePosition[1] -=20 
if direction=="'down': 
snakePosition[1]+=20 


snakePosition 为 蛇 头 的 新 位 置 , 程序 开始 处 的 另 一 个 列表 变量 snakeSegments 却 不 是 这 
样 。 该 列表 存储 蛇 身 体 的 位 置 〈 头 部 后 边 )， 随 着 蛇 吃 掉 草 莓 导致 长 度 增加 ， 列 表 会 增加 长 
度 同时 提高 游戏 难度 。 随 着 游戏 的 进行 ， 避 免 蛇 头 撞 到 身体 的 难度 变 大 。 如 果 蛇 头 撞 到 身 
体 ， 蛇 会 死亡 ， 同 时 游戏 结束 。 此 时 用 下 面 的 代码 使 蛇 的 身体 增长 : 

snakeSegments.insert (0,1ist (snakePosition)) 


这 里 用 insert0 方 法 向 snakeSegments 列表 ( 存 有 蛇 当前 的 位 置 ) 中 添加 新 项 目 。 每 当 
Python 运行 到 这 一 行 ， 它 就 会 将 蛇 的 身体 增加 一 节 ， 同 时 将 这 一 节 放 在 蛇 的 头 部 ， 在 玩家 
看 来 蛇 在 增长 。 当 然 ， 用 户 只 希望 蛇 吃 到 草 蓉 时 才 增 长 ， 否 则 蛇 会 一 直 变 长 。 输 入 下 面 的 
几 行 代码 : 


if snakePosition[0]==raspberryPosition[0] 

















and snakePosition[1]==raspberryPosition[1]: 


raspberrySpawned=0 
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else: 


SnakeSegments-pop() 


第 1 条 下 语句 检查 蛇 头 部 的 x 和 y 坐标 是 否 等 于 草莓 〈 玩 家 的 目标 点 ) 的 坐标 。 如 果 
等 于 ， 该 草莓 就 会 被 蛇 吃 掉 ， 同 时 raspberrySpawned 变量 置 为 0。else 语句 告诉 Python 如 
果 草莓 没有 被 吃 掉 ， 将 snakeSegments 列表 中 最 早 的 项 目 pop 出 来 。 

pop 语句 简单 、 易 用 ， 它 返回 列表 中 末尾 的 项 目 并 从 列表 中 删除 ， 使 列表 缩短 一 项 。 
在 snakeSegments 列表 里 ， 它 使 Python 删 掉 距离 头 部 最 远 的 一 部 分 。 在 玩家 看 来 ， 蛇 整体 
在 移动 而 不 会 增长 。 实 际 上 ， 它 在 一 端 增加 小 节 ， 在 另 一 端 删除 小 节 。 由 于 有 else 语句 ， 
pop 语句 只 有 在 没 吃 到 草莓 时 执行 。 如 果 吃 到 了 草莓 ， 列 表 中 的 最 后 一 项 不 会 被 删 掉 ， 所 
以 蛇 会 增加 一 小 节 。 

现在 , 蛇 就 可 以 通过 吃 草莓 让 自己 变 长 了 。 但 是 如 果 游 戏 中 只 有 一 个 草莓 会 有 些 无 聊 ， 
所 以 若 蛇 吃 了 一 个 草莓 ， 用 下 面 的 代码 增加 一 个 新 的 草莓 到 游戏 界面 中 : 


if raspberrySpawned==0: 





x=random.randrange (1, 32) 
y=random.randrange (1,24) 
raspberryPosition=[int (x*20), int (y*20)] 


raspberrySpawned=1 


这 部 分 代码 通过 判断 变量 raspberrySpawned 是 否 为 0 来 判断 草莓 是 否 被 吃 掉 了 ， 如 果 
被 吃 掉 ， 使 用 程序 开始 引入 的 random 模块 获取 一 个 随机 的 位 置 。 然 后 将 这 个 位 置 和 蛇 的 
每 个 小 节 的 长 度 (20 像素 宽 ，20 像素 高 ) 相 乘 来 确定 它 在 游戏 界面 中 的 位 置 。 随 机 地 放置 
草莓 是 很 重要 的 ， 防 止 用户 预 先知 道 下 一 个 草莓 出 现 的 位 置 。 最 后 将 raspberrySpawned 变 
量 置 1， 以 保证 每 个 时 刻 界 面 上 只 有 一 个 草莓 。 
现在 有 了 让 蛇 移 动 和 生长 的 代码 ， 包 括 草莓 被 吃 和 新 建 的 操作 〈 在 游戏 中 称 为 草莓 重 
生 )， 但 是 还 没有 在 界面 上 画 东 西 ， 输 入 下 面 的 代码 : 
PlaySurface.fill(blackColour) 
for position in snakeSegments: # 画 蛇 (一 系列 方块 》 
pygame .draw.rect (playSurface, whiteColour, Rect (position[0], 
position[1], 20, 20)) 
pygame .draw.rect (playSurface, redColour, Rect (raspberryPosition[0], 
raspberryPosition[1], 20, 20)) # 草 莓 
pygame.display.flip() 


这 些 代码 让 Pygame 填充 背景 色 为 黑色 ， 蛇 的 头 部 和 身体 为 白色 ， 草 莓 为 红色 。 最 后 
一 行 的 pygame.display.flip(0 让 Pygame 更 新 界面 (如果 没有 这 条 语句 ， 用 户 将 看 不 到 任何 
东西 。 每 次 在 界面 上 夯 完 对 象 时 ， 记 得 使 用 pygame.display.flip0) 让 用 户 看 到 更 新 )。 

现在 还 没有 涉及 蛇 死亡 的 代码 。 如果 游戏 中 的 角色 永远 死 不 了 , 玩家 很 快 会 感到 无 聊 ， 
所 以 用 下 面 的 代码 设置 一 些 让 蛇 死 亡 的 场景 : 


if snakePosition[0]>620 or snakePosition[0]<0: 












































gameOver () 
if snakePosition[1]>460 or snakePosition[1]<0: 
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gameOver () 
第 1 个 站 语句 检查 蛇 是 否 已 经 走出 了 界面 的 上 、 下 边界 , 第 2 个 站 语句 检查 蛇 是 否 已 
经 走出 了 左 、 右 边界 。 这 两 种 情况 都 是 蛇 的 末日 ， 触 发 前 面 定义 的 gameOver0) 函 数 ， 打 印 
游戏 结束 信息 并 退出 游戏 。 如 果 蛇 头 撞 到 了 自己 身体 的 任何 部 分 ， 也 会 让 蛇 死亡 ， 所 以 输 
入 下 面 几 行 代码 : 


for snakeBody in snakeSegments[1:]: 




















if snakePosition[0]==snakeBody[0] and 
snakePosition[1]==snakeBody[1]: 
gameOver () 


这 里 的 for 语句 遍历 蛇 的 每 一 小 节 的 位 置 ( 从 列表 的 第 2 项 开始 到 最 后 一 项 )， 同 时 和 
当前 蛇 头 的 位 置 比较 。 这 里 用 snakeSegments[1:] 来 保证 从 列表 的 第 2 项 开始 遍历 。 列 表 的 
第 1 项 为 头 部 位 置 ， 如 果 从 第 1 项 开始 比较 ， 那 么 游戏 一 开始 蛇 就 死亡 了 。 

最 后 ， 只 需要 设置 fpsClock 变量 的 值 即 可 控制 游戏 速度 。 

fpsClock.tick(20) 


使 用 IDLE 的 Run Module 选项 或 者 在 终端 中 输入 python snake.py 来 运行 程序 。 
贪 吃 蛇 snake.py 的 完整 源 代码 如 下 : 


import pygame, sys, time, random 
from pygame.locals import * 





pygame .init() 
fpsClock=pygame .time.Clock() 
playSurface=pygame.display.set mode((640, 480)) 
pygame .display.set caption('Raspberry Snake') 
# 定 义 一 些 颜色 
redColour=pygame.Color (255, 0, 0) 
blackColour=pygame .Color (0, 0, 0) 
whiteColour=pygame.Color (255, 255, 255) 
greyColour=pygame.Color (150, 150, 150) 
# 初 始 化 程序 中 用 到 的 一 些 变 量 
snakePosition=[100,100] 
snakesegments=[ [100,100], [80,100], [60,100]] 
raspberryPosition=[300,300] # 草 莓 位 置 
raspberrySpawned=1 # 是 否 吃 到 草莓 ，1 为 没有 吃 到 ，0 为 吃 到 
direction='right'" # 运 动 方向 
changeDirection=direction 
def gameOver () : 
gameOverFont=pygame.font.Font ('simfang.ttf', 72) 
gameOverSurf=gameOverFont.render ('Game Over', True, greyColour) 
gameOverRect=gameOverSurf.get rect() 
gameOverRect .midtop=(320, 10) 
playSurface.blit (gameOverSsurf, gameOverRect) 
pygame.display.flip() 
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time.sleep(5) 
pygame.quit () 
sys.exit() 
while True: 
for event in pygame.event.get(): 
if event.type==QUIT: 
pygame.quit () 
sys.exit() 
elif event .type==KEYDOWN: 
if event.key==K RIGHT or event.key==ord('d'): 
changeDirection="'right" 
if event.key==K LEFT or event.key==ord('a') : 
changeDirection='left'" 
if event .key==K UP or event .key==ord('w') : 
changeDirection='up'" 
if event .key==K DOWN or event.key==ord('s'): 
changeDirection="'down"' 
if event.key==K ESCAPE: 
pygame .event .post (pygame .event .Event (QUIT) ) 
if changeDirection=='"'right' and not direction=='left': 
direction=changeDirection 
if changeDirection=='left' and not direction=='right': 
direction=changeDirection 
if changeDirection=='up' and not direction=='down' : 
direction=changeDirection 
if changeDirection=='down' and not direction=='up': 
direction=changeDirection 
if direction=='right' : 
snakePosition[0]+=20 
if direction=='"left': 
snakePosition[0]-=20 
if direction=='up' : 


snakePosition[1]-=20 








if direction=='"down' : 
snakePosition[1]+=20 
# 将 蛇 的 身体 增加 一 节 ， 同 时 将 这 一 节 放 在 蛇 的 头 部 


SnakeSegments.insert(0,1ist(snakePosition)) 


# 检 查 蛇 头 部 的 x 和 Y 坐标 是 否 等 于 草莓 〈 玩 家 的 目标 点 ) 的 坐标 


if snakePosition[0]==raspberryPosition[0] and snakePosition[1]== 


raspberryPosition[1]: 
raspberrySpawned=0 


else: 
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snakeSegments .pop () 
# 在 游戏 界面 中 增加 一 个 新 的 草莓 
if raspberrySpawned==0: 
x=random.randrange (1, 32) 
y=random.randrange (1, 24) 
raspberryPosition = [int(x*20) ,int(y*20) ] 
raspberrySpawned=1 
playSurface.fill (blackColour) 
for position in snakeSegments: # 画 蛇 ( 一 系列 方块 
pygame.draw.rect (playSurface, whiteColour, Rect (position[0], 
position[1], 20, 20)) 
# 画 草 葡 
pygame .draw.rect (playSurface, redColour, Rect (raspberryPosition[0], 
raspberryPosition[1], 20, 20)) 
pygame.display.flip() 
if snakePosition[0]>620 or snakePosition[0] < 0: 
gameOver () 
if snakePosition[1]>460 or snakePosition[1] < 0: 
gameOver () 
for snakeBody in snakeSegments[1:]: 
if snakePosition[0]==snakeBody[0] and snakePosition[1]== 
snakeBody[1]: 
gameOver () 
fpsClock.tick(10) 


174 基于 Pygame 设计 飞机 大 战 游戏 


相信 玩 过 《雷电 》 的 朋友 都 熟悉 打 飞 机 ， 这 里 将 游戏 做 了 简化 。 飞 机 的 速度 固定 ， 子 
弹 的 速度 固定 ， 基 本 操作 是 通过 键盘 移动 玩家 飞机 ， 政 机 随机 从 屏幕 上 方 出 现 并 匀速 落 到 
下 方 ， 子 弹 从 玩家 飞机 发 出 ， 碰 到 目标 飞机 会 击毁 ， 如 果 目 标 飞机 碰 到 玩家 飞机 ， 则 游戏 
结束 并 显示 分 数 。 飞 机 大 战 游戏 的 运行 效果 如 图 17-8 所 示 。 


17.4.1 游戏 角色 


本 游戏 中 所 需 的 角色 包括 玩家 飞机 、 政 机 及 子弹 。 用 户 可 以 通过 键盘 移动 玩家 飞机 在 
屏幕 上 的 位 置 来 打 不 同位 置 的 敌 机 , 因此 设计 玩家 类 Player、 敌 机 类 Enemy 和 子弹 类 Bullet 
对 应 3 种 游戏 角色 。 

对 于 玩家 类 Player， 需 要 的 操作 有 射击 和 移动 两 种 ， 移 动 又 分 为 上 、 下 、 左 、 右 4 种 
情况 。 
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图 17-8 飞机 大 战 游戏 的 运行 效果 


对 于 敌 机 类 Enemy, 则 比较 简单 , 只 需要 移动 即 可 , 从 屏幕 上 方 出 现 并 移动 到 屏幕 下 方 。 

对 于 子弹 类 Bullet， 与 飞机 相同 ， 仅 需要 以 一 定 的 速度 移动 即 可 。 

玩家 、 子 弹 和 敌 机 都 可 以 写成 一 个 类 ， 继 承 Pygame 的 Sprite 类 ， 实 现 一 些 动画 效果 
以 及 检测 碰撞 。 


import pygame 

from sys import exit 

from pygame.locals import * 
#from gameRole import * 


import random 


SCREEN_ WIDTH=480 
SCREEN HEIGHT=800 
TYPE SMALL=1 
TYPE MIDDLE=2 
TYPE BIG=3 


# 子 弹 类 
class Bullet (pygame.sprite.-Sprite) : # 继 承 Sprite 精灵 类 
def _ init_ _ (self，bullet img, init pos) : 
pygame.sprite.sprite. init _(self) 
self.image=bullet img 
self.rect=self.image.get rect() 
self.rect.midbottom=init pos 
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self.speed=10 
def move (self): 
self.rect.top-=self.speed 
# 玩 家 类 
class Player (pygame.sprite.Ssprite): # 继 承 Sprite 精灵 类 
def _ init (self, plane img, player rect, init pos): 
pygame.sprite.sprite. init _(self) 
self.image=[] # 用 来 存储 玩家 对 象 精灵 图 片 的 列表 
for i in range(len(player rect) ) : 
self.image.append (plane img.subsurface (Player_rect[i]) 
.Convert alpha()) 


self.rect=player rect[0] # 初 始 化 图 片 所 在 的 拖 形 
self.rect.topleft=init pos # 初 始 化 矩形 的 左上 角 坐 标 
self.speed=8 # 初 始 化 玩家 速度 ， 这 里 是 一 个 确定 的 值 
self.bullets=pygame.sprite.Group()  # 玩 家 飞机 所 发 射 的 子弹 的 集合 
self.img index=0 # 玩 家 精灵 图 片 索引 

self.is hit=False # 玩 家 是 否 被 击 中 


def shoot(self, bullet img): 
bullet=Bullet (bullet img, self.rect.midtop) 
self.bullets.add (bullet) 
def moveUp (self) : 
if self.rect.top <= 0: 
self.rect .top=0 
ES 
self.rect .top-=self.speed 
def moveDown (self): 
if self.rect.top>=SCREEN HEIGHT-self.rect.height: 
self.rect.top=SCREEN HEIGHT-self.rect.height 
Sse 
self.rect .top+=self .speed 
def moveLeft (self): 
if self.rect.left<=0: 
self.rect. Left=0 
else 
self.rect.left-=self.speed 
def moveRight (self): 
if self.rect.left>=SCREEN WIDTH-self.rect.width: 
self.rect.left=SCREEN WIDTH-self.rect.width 
1Ses 
self.rect.left+=self.speed 
# 敌 机 类 
class Enemy (pygame.sprite.Ssprite): # 继 承 Sprite 精灵 类 
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def init (self, enemy img, enemy down imgs, init pos): 
pygame.sprite.sprite. init _(self) 
self.image=enemy img 
self.rect=self.image. get rect() 
self.rect.topleft=init pos 
self.down imgs=enemy down imgs 
Self.speed=2 
self.down index=0 
def move (self): 
Self.rect .topt+=self .speed 


以 上 设计 了 游戏 中 的 3 个 角色 。 


17.4.2 ”游戏 界面 显示 


在 游戏 画面 中 使 用 了 一 些 飞机 、 子 弹 图 像 ， 这 里 使 用 shoot.png 文件 (如 图 17-9 所 示 ) 
存储 所 有 飞机 、 子 弹 、 爆 炸 等 图 像 ， 在 程序 中 需要 分 割 出 来 显示 。 当 然 ， 可 以 用 图 像 处 理 
软件 分 解 成 一 个 个 独立 文件 ， 这 样 处 理 后 开发 程序 简单 些 。 


























向 克 二 本 ， 


图 17-9 飞机 大 战 游戏 的 图 像 文件 shootpng 


所 有 的 飞机 都 在 shoot.png 图 片 中 ,在 游戏 中 显示 的 元 素 (包括 飞机 、 子 弹 等 ) 在 Pygame 
中 都 是 一 个 surface， 这 时 可 以 利用 Pygame 提供 的 subsurface() 方 法 ， 首 先 载 入 一 张大 图 ， 
然后 调用 subsurface() 方 法 选取 其 中 的 一 小 部 分 生成 一 个 新 的 surface。 

# 载 入 飞机 图 片 

plane img=pygame.image.load('resources/image/shoot.png') 


# 选 择 飞机 在 大 图 中 的 位 置 ， 并 生成 subsurface， 然 后 初始 化 飞机 开始 的 位 置 
player rect=pygame.Rect (0, 99, 102, 126) 





playerl=plane img.subsurface (player rect) # 获 取 飞 机 图 片 
player pos=[200, 600] 
screen.blit (playerl, player pos) # 绘 制 飞机 
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初始 化 游戏 并 根据 设置 好 的 大 小 生成 游戏 窗口 ， 载 入 游戏 音乐 、 背 景 图 片 background 
.png、 游 戏 结束 画面 gameoverpng 以 及 飞机 和 子弹 图 像 shoot.png; 设置 相关 参数 。 最 后 定义 
存储 敌人 的 飞机 精灵 组 enemiesl 和 用 来 泻 染 击毁 精灵 动画 的 爆炸 飞机 精灵 组 enemies_down。 


# 初 始 化 游戏 


pygame.init() 
screen=pygame.display.set mode( (SCREEN WIDTH, SCREEN HEIGHT)) 
pygame .display.set caption ("飞机 大 战 ' ) 





























# 载 入 游戏 音乐 

bullet sound=pygame.mixer.Sound('resources/sound/bullet .wav') 

enemyl down sound=pygame.mixer.Sound('resources/sound/enemyl down.wav') 
game over sound=pygame.mixer.Sound('resources/sound/game over.wav') 
bullet sound.set volume (0.3) 

enemyl down sound.set volume (0.3) 

game over sound.set volume(0.3) 

pygame .mixer.music.load('resources/sound/game music.wav') 

pygame .mixer.music.play(-1，0.0) 

pygame .mixer.music.set volume (0.25) 


background=pygame .image.load('resources/image/background.png') 
.convert () # 载 入 背景 图 
game over=pygame.image.1load('resources/image/gameover.png') 


# 载 入 游戏 结束 图 gameover .png 


filename='resources/image/shoot .png' 


plane img=pygame.image.1oad (filename) # 载 入 飞机 和 子弹 图 shoot .png 

# 设 置 玩家 相关 参数 

player rect=[] 

player rect.append (pygame.Rect (0, 99, 102, 126)) # 玩 家 精灵 图 片区 域 
player rect.append (pygame.Rect (165, 360, 102, 126)) 

player_rect.append (pygame.Rect (165, 234, 102, 126)) # 玩 家 爆炸 精灵 图 片区 域 


player rect.append (pygame.Rect (330, 624, 102, 126)) 
player rect.append (pygame.Rect (330, 498, 102, 126)) 
player rect.append (pygame.Rect (432, 624, 102, 126)) 
player pos=[200, 600] 

player=Player (plane img, player rect, player pos) 


# 定 义 子弹 对 象 使 用 的 surface 相关 参数 
bullet rect=pygame.Rect (1004, 987, 9, 21) 
bullet img=plane img.subsurface (bullet rect) 


# 定 义 敌 机 对 象 使 用 的 surface 相关 参数 
enemyl rect=pygame.Rect (534, 612, 57, 43) 


enemyl img=plane img.subsurface (enemyl rect) 
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enemyl down imgs=[] 


enemyl down imgs .append (plane img.subsurface (pygame.Rect (267, 347, 57, 


43))) 

enemyl down imgs .append (plane img.subsurface (pygame.Rect (873, 697, 57, 
43))) 

enemyl down imgs .append (plane img.subsurface (pygame.Rect (267, 296, 57, 
43))) 

enemyl down imgs.append (plane img.subsurface (pygame.Rect (930, 697, 57, 
43))) 

enemiesl=pygame.sprite.Group() # 存 储 敌 人 的 飞机 

enemies down=pygame.sprite.Group () # 存 储 被 击毁 的 飞机 ， 用 来 泻 染 击毁 精灵 动画 


shoot frequency=0 

enemy frequency=0 

player down index=16 
score=0 

clock=pygame .time.Clock () 
running=True 


17.4.3 ”游戏 的 逻辑 实现 


下 面 进入 游戏 主 循环 ， 在 主 循环 中 进行 了 以 下 操作 : 

@ 处 理 键盘 输入 的 事件 ， 增 加 游戏 操作 交互 

处 理 键盘 输入 的 事件 指 上 、 下 、 左 、 右 按键 操作 ， 增 加 游戏 操作 交互 指 玩家 飞机 的 上 、 
左 、 右 移动 。 


key pressed=pygame.key.get Pressed () 
# 若 玩家 被 击 中 ， 则 无 效 
if not player.is hit: 
if key pressed[K w] or key_ pressed[K UP]: 处 理 键盘 事件 (移动 飞机 的 位 置 ) 
Player.moveUp () 
if key pressed[K s] or key pressed[K DOWN] :# 处 理 键盘 事件 〈 移 动 飞 机 的 位 置 ) 
player.moveDown () 
if key pressed[K a] or key pressed[K LEFT] :# 处 理 键盘 事件 (移动 飞 机 的 位 置 ) 
Player.moveLeft () 
if key pressed[K d] or key pressed[K RIGHT] : # 处 理 键盘 事件 (移动 飞机 的 位 置 ) 
player.moveRight () 


@ 处 理子 弹 
这 里 控制 发 射 子弹 的 频率 并 发 射 子 弹 , 移动 已 发 射 过 的 子弹 , 若 超 出 窗口 范围 则 删除 。 
# 控 制 发 射 子 弹 的 频率 并 发 射 子 弹 


if not player.is hit:  # (1) 判断 玩家 飞机 没有 被 击 中 
if shoot frequency%s15==0: 


志 
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bullet sound-play() 
player.shoot (bullet img) 
shoot frequency+=1 
if shoot frequency>=15: 
shoot frequency=0 
# 移 动 已 发 射 过 的 子弹 ， 若 超出 窗口 范围 则 删除 
for bullet in player.bullets: 
bullet .move () 
if bullet.rect.bottom<0: 
player.bullets.remove (bullet) 


@ 政 机 处 理 
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# (2) 以 固定 速度 移动 子弹 
# (3) 子弹 移动 出 屏幕 后 删除 子弹 
# 删 除 子弹 


敌 机 需要 在 界面 上 方 随机 产生 ， 并 以 一 定 的 速度 向 下 移动 ， 详 细 步骤 如 下 : 


(1) 生成 敌 机 ， 需 要 控制 生成 频率 。 
(2) 移动 敌 机 。 

(3) 敌 机 与 玩家 飞机 碰撞 效果 的 处 理 。 
(4) 移出 屏幕 后 删除 敌 机 。 

(5) 敌 机 被 子弹 击 中 效果 的 处 理 。 

和 @ 得 分 显示 








在 游戏 界面 的 固定 位 置 显示 消灭 了 多 少 目标 敌 机 。 


Score font=pygame .font.Font (None, 36) 


Score text=score font.render(str(score), True, (128, 128, 128))text rect 


=score text.get rect() 
text rect.topleft=[10, 10] 
screen.blit (score text, text rect) 


游戏 主 循环 的 完整 代码 如 下 : 


while running: 
clock.tick(60) 
# 控 制 发 射 子 弹 的 频率 并 发 射 子 弹 
if not player.is hit: 
if shoot frequency % 15==0: 
bullet sound.play() 
player.shoot (bullet img) 
shoot frequency+=1 
if shoot frequency>=15: 
shoot frequency=0 
# 移 动 子 弹 ， 若 超出 窗口 范围 则 删除 
for bullet in player.bullets: 
bullet.move () 
if bullet.rect.bottom<0: 


player.bullets.remove (bullet) 


# 生 成 敌 机 


# 控 制 游戏 最 大 帧 率 为 60 
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if enemy frequency $$ 50==0: ##(1) 生成 敌 机 ， 需 要 控制 生成 频率 
enemyl pos=[random.randint (0, SCREEN WIDTH - enemyl rect.width), 0] 
enemyl=Enemy (enemyl img, enemyl down imgs, enemyl pos) 
enemies]l .add (enemy1) 

enemy frequency+=1 

if enemy frequency>=100: 


enemy frequency=0 


# 移 动 敌 机 ， 若 超出 窗口 范围 则 删除 
for enemy in enemjiesl: 
enemy .move () #(2) 移动 敌 机 
# 判 断 玩 家 是 否 被 击 中 
if pygame.sprite.collide circle(enemy, player): 
#(3) 政 机 与 玩家 飞机 碰撞 效果 的 处 理 
enemies down.add (enemy) 
enemies]l .remove (enemy) 
player.is hit=True 
game over sound.play() 
break 
if enemy.rect.top > SCREEN HEIGHT: 站 (4) 移出 屏幕 后 删除 飞机 
enemies]l .remove (enemy) 
# (5) 政 机 被 子弹 击 中 效果 的 处 理 
# 将 被 击 中 的 敌 机 对 象 添加 到 击毁 敌 机 Group 中 ， 用 来 泻 染 击毁 动画 
enemiesl down =pygame.sprite.groupcollide (enemies1l, player.bullets, 1, 1) 
for enemy down in enemiesl down: 
enemies_ down -add (enemy_ down) 


# 绘 制 背景 
screen.fill (0) 
screen.blit (background, (0, 0)) 


# 绘 制 玩家 飞机 
if not player.is hit: 
screen.blit (player.image [player.img index], player.rect) 


# 更 换 图 片 索 引 使 飞机 有 动画 效果 


player.img index=shoot frequency es 
人 
player.img index=player down index LS 


screen.blit (player.image [player.img index], player.rect) 
player down index+=1 
if player down index>47: 

running=False 


# 绘 制 击毁 动画 


for enemy down in enemies down: 


第 17 章 基于 Pygame 的 游戏 设计 1 7 


if enemy down.down index==0: 
enemyl down sound.play() 

if enemy down.down index>7: 
enemies down.remove (enemy down) 
score+=1000 


continue 





screen.blit (enemy down.down imgs [enemy down.down index // 2], 


enemy down.rect) 
enemy down.down index+=1 
# 绘 制 子 弹 和 敌 机 
player.bullets.draw (screen) 
enemiesl .draw (screen) 
# 绘 制 得 分 
Score font=pygame.font.Font (None, 36) 
score text=score font.render (str (Score)，True， (128, 128, 
text rect=score text.get rect() 
text rect.topleft=[10, 10] 
screen.blit (score text, text rect) 
# 更 新 屏幕 
pygame.display.update () 
for event in pygame .event .get() : 
if event .type==pygame .QUIT : 
pygame.quit () 
exit() 
# 监 听 键 盘 事 件 
key pressed=pygame .key.get pressed() 
# 若 玩家 被 击 中 ， 则 无 效 
if not player.is hit: 
ER key_pressed[K w] or key pressed[K UP]: 
player.moveUp () 
if key pressed[K s] or key pressed[K DOWN]: 
player.moveDown () 
if key pressed[K a] or key pressed[K LEFT]: 
player.moveLeft () 
if key pressed[K d] or key pressed[K RIGHT]: 
player.moveRight () 
font=pygame.font.Font (None, 48) 
text=font .render('Score: '+ str(score), True, (255, 0, 0)) 
text rect=text.get rect'() 
text rect.centerx=screen.get rect() .centerx 
text rect.centery=screen.get rect() .centery+24 
screen.blit (game over, (0, 0)) 
screen.blit (text, text rect) 
while 1: 


for event in pygame.event.get(): 


128)) 
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if event .type==pygame.QUIT: 
pygame.quit () 
exit() 
pygame .display.update() 


目前 基本 实现 了 玩家 移动 并 发 射 子弹 、 随 机 生成 敌 机 、 击 中 敌 机 并 爆炸 、 玩 家 飞机 被 
击毁 、 背 景 音 乐 及 音效 、 游 戏 结束 并 显示 分 数 这 几 项 功能 ， 已 经 是 一 个 简单 、 可 玩 的 游戏 。 
整个 游戏 的 实现 不 到 300 行 代码 ， 可 以 看 出 Python 代码 是 多 么 简洁 和 高 效 。 
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18.1 文本 分 类 功能 介绍 


对 于 分 类 问题 ， 其 实 大 家 都 很 熟悉 ， 说 每 个 人 每 天 都 在 执行 分 类 操作 罗 和 
一 点 也 不 夸张 ， 只 是 大 家 没有 意识 到 罢了 。 例 如 ， 当 看 到 一 个 陌生 人 ,， 脑 “9 
子 里 会 下 意识 地 判断 是 男 是 女 ; 走 在 路 上 , 可 能 经 常会 对 身 旁 的 朋友 说 “这 视频 讲解 
个 人 一 看 就 很 有 钱 ”“ 这 个 人 看 着 很 谦和 ”之 类 的 话 ， 其 实 这 就 是 一 种 分 类 操作 ， 也 就 是 根 
据 这 个 人 身上 的 某 些 特征 做 出 的 一 个 推断 。 

文本 分 类 和 其 他 分 类 本 质 上 是 一 样 的 ， 只 不 过 分 类 的 对 象 是 文本 。 文 本 分 类 问题 是 根据 
文本 的 特征 将 其 分 到 预先 设 定好 的 类 别 中 , 类 别 可 以 是 两 类 ， 也 可 以 是 更 多 的 类 别 。 文 本 数据 
是 互联 网 时 代 的 一 种 最 常见 的 数据 形式 ， 新 闻 报 道 、 电 子 邮件 、 网 页 、 评 论 留 言 、 博 客 文章 、 
学 术 论文 等 都 是 常见 的 文本 数据 类 型 , 文本 分 类 问题 所 采用 的 类 别 划分 往往 也 会 根据 目的 不 同 
而 有 较 大 差别 。 例 如 ， 根 据 文本 内 容 可 以 有 “政治 ”“ 经 济 ”“ 体 育 ”等 不 同类 别 ; 根 据 应 用 目 
的 要 求 ， 在 检测 垃圾 邮件 时 可 以 有 “垃圾 邮件 ”和 “ 非 垃 圾 邮件 ”根据 文本 特点 ， 在 做 情感 
分 析 时 可 以 有 “积极 情感 文本 ”和 “消极 情感 文本 ”。 可 见 ， 文 本 分 类 的 应 用 非常 广泛 。 

常用 的 文本 分 类 算法 有 朴素 贝 叶 斯 算法 、 支 持 向 量 机 算法 、 决 策 树 、KNN 最 近邻 算法 
等 。KNN 最 近邻 算法 的 原理 最 简单 ， 但 是 分 类 精度 一 般 ， 速 度 很 慢 ; 朴素 贝 叶 斯 算法 对 于 
短文 本 分 类 效果 最 好 ， 精 度 很 高 ， 支 持 向 量 机 算法 的 优势 是 支持 线性 不 可 分 的 情况 ， 在 精 
度 上 取 中 。 本 章 以 朴素 贝 叶 斯 算法 为 例 讲解 文本 分 类 的 一 般 过 程 ， 并 以 垃圾 邮件 过 滤 作为 
朴素 贝 叶 斯 算法 的 一 个 应 用 案例 进行 测试 。 











18.2 程序 设计 的 思路 


文本 分 类 主要 有 3 个 步 又: 








| 区 县 项 目 案例 开发 
从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 

@ 文本 的 表达 

这 个 阶段 的 主要 任务 是 将 文档 转变 成 矢量 形式 ， 常 用 且 最 简单 的 就 是 词 集 模型 。 其 基 
本 思想 是 假定 对 于 一 个 文档 忽略 其 词 序 、 语 法 和 句法 等 要 素 ， 将 文档 仅仅 看 作 是 若干 词汇 
的 集合 ， 而 文档 中 每 个 单词 的 出 现 都 是 独立 的 ， 不 依赖 于 其 他 词汇 的 出 现 。 简 单 来 说 ， 就 
是 将 每 篇 文档 都 看 成 一 个 词汇 集合 ， 然 后 看 这 个 集合 里 出 现 了 什么 词汇 ， 将 其 分 类 。 例 如 
有 以 下 两 个 文档 。 

文档 一 : Bob likes to play basketball,Jim likes too. 

文档 二 : Bob also likes to play football games. 

基于 这 两 个 文档 ， 先 构造 一 个 词汇 表 : 

wordList={"Bob", "likes", "to", "play", "basketball", "Jim", "too", "also", 

"football", "games"} 

可 以 看 到 ， 这 个 词汇 表 由 10 个 不 同 的 单词 组 成 ， 利 用 单词 在 词汇 表 中 的 索引 ， 上 面 
两 个 文档 都 可 以 用 一 个 10 维 向 量 表示 , 向 量 中 的 每 个 元 素 表示 词汇 表 中 的 相应 单词 在 文档 
中 是 否 出 现 ， 出 现 为 1， 不 出 现 为 0。 

文档 一 : [1,1,1,1,1,1,1,0,0,0] 

文档 二 : [1,1,1,1,0,0,0,1,1,1] 

@ 分 类 器 的 选择 与 训练 

这 个 阶段 是 文本 分 类 的 关键 步 又， 使 用 的 分 类 算法 不 同 ， 具 体 步 又 也 不 同 ， 这 里 使 用 
朴素 贝 叶 斯 算法 进行 文本 分 类 ， 有 具体 将 在 18.3 节 详 细 介 绍 。 

@ 分 类 结果 的 评价 

机 器 学 习 领 域 的 算法 评估 常用 的 评价 指标 如 下 : 

错 分 率 = 所 有 分 类 错误 的 记录 数 /测试 集中 的 记录 总 数 

准确 率 = 被 识别 为 该 分 类 的 正确 分 类 记录 数 /被 识别 为 该 分 类 的 记录 数 

召回 率 = 被 识别 为 该 分 类 的 正确 分 类 记录 数 /测试 集中 该 分 类 的 记录 总 数 

Fl-score=2( 准 确 率 x 召 回 率 )/( 准 确 率 + 召回 率 ) 


18.3 ”关键 技术 
18.3.1 ” 贝 叶 斯 算法 的 理论 基础 


@ 条 件 概率 

假设 一 个 盒子 里 装 了 9 个 小 球 ， 如 图 18-1 所 示 ， 其 中 4 个 黑色 的 、5 个 白色 的 ， 如 果 
从 盒子 里 随机 取 一 个 小 球 ， 那 么 是 黑色 小 球 的 可 能 性 有 多 大 ? 由 于 取 小 球 有 9 种 可 能 ， 翰 
中 4 种 为 黑色 , 所 以 取出 黑色 小 球 的 概率 为 4/9。 那 么 取出 白色 小 球 的 概率 又 会 是 多 少 呢 ? 
很 显然 ， 是 5/9。 如 果 用 P(black) 表 示 取 黑色 小 球 的 概率 ， 其 概率 值 等 于 黑色 小 球 的 数量 除 
以 小 球 总 数 。 
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图 18-1 一 个 装 有 9 个 小 球 的 盒子 


如 果 将 9 个 小 球 分 开放 在 两 个 盒子 中 , 如 图 18-2 所 示 ， 那 么 上 述 概率 应 该 如 何 计 算 ? 


A 盒 B 盒 
图 18-2 将 9 个 小 球 分 别 放 在 两 个 盒子 中 


将 9 个 小 球 如 图 18-2 所 示 放 在 两 个 盒子 中 ， 要 计算 P(black) 或 者 P(white)， 事 先 得 知 
小 球 所 在 盒子 的 信息 会 不 会 改变 结果 ? 假设 从 A 盒 中 取出 黑色 小 球 的 概率 为 P(black|A 
盒 )， 即 “在 已 知 小 球 取 自 A 盒 的 情况 下 取出 黑色 小 球 的 概率 ”， 容 易 得 到 从 A 盒 中 取出 黑 
色 小 球 的 概率 P(black|A 盒 ) 为 /4， 这 就 是 所 谓 的 条 件 概率 。 

条 件 概 率 的 定义 :已 知事 件 B 发 生 的 条 件 下 事件 A 发 生 的 概率 称 为 事件 A 关于 事件 B 
的 条 件 概 率 ， 记 为 P(AIB)。 对 于 任意 事件 A 和 B， 若 P(B)#0， 则 “在 事件 B 发 生 的 条 件 


下 事件 A 发 生 的 条 件 概 率 ” 记 为 P(AIB)， 定 义 为 P(A1B) = 


那么 ， 对 于 小 球 这 个 例子 来 说 ， 依 据 条 件 概率 的 定义 ，P(black|A 盒 )=P(black and A 
盒 )/P(A 盒 )。 
下 面 来 看 上 述 公式 是 否 合理 。P(black and A 盒 ) 表 示 取 出 A 盒 中 黑色 小 球 的 概率 , 用 A 
盒 中 的 黑色 小 球 数量 除 以 小 球 总 数 可 得 ， 即 1/9; P(A 盒 ) 表 示 从 A 盒 中 取 小 球 的 可 能 性 ， 
即 用 A 盒 中 的 小 球 数量 除 以 小 球 总 数 ,， 即 4/9。 于 是 有 P(black|A 盒 )-P(black and A 盒 ))P(A 
盒 )=(1/9)/(4/9)=1/4， 结 论 与 前 面 分 析 得 到 的 结果 相同 ， 说 明 公式 完全 合理 。 
@ 全 概率 公式 
若 事件 组 (A,A>,…,An) 满 足以 下 关系 : 
(1) Ai(i=1,2,…,n) 两 两 互 斥 ， 且 P(Ai)>0。 
(2) A; =Q ，Q 为 样本 空间 。 
则 称 事件 组 (A1,A2,…,As) 是 样本 空间 Q 的 一 个 划分 。 
全 概率 公式 : 设 (A1,A2,…,An) 是 样本 空间 Q 的 一 个 划分 ，B 为 任 一 事件 ， 则 有 
P(B) = ,P(Ai)P(BIA;) 


i=1 
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| 深 要 项 目 案例 开发 
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@ mi 公式 
设 (A1,A2…,A) 是 样本 空间 Q 的 一 个 划分 ，B 为 任 一 事件 ， 则 有 
PCA | 本 -PCAB) _ _ PAPBIA,) 
?四 六 pwA)PGBIA)) 
j=1 


上 式 中 的 Ai 常 被 视 为 导致 试验 结果 B 发 生 的 “原因 ”，P(Ai) (i=1,2,…,n) 表示 各 种 
原因 发 生 的 可 能 性 大 小 ， 故 称 先 验 概率 ;P(AilB) (i=1,2,…,n〉 则 反映 当 试 验 产 生 了 结果 B 
之 后 再 对 各 种 原因 概率 的 新 认识 ， 故 称 后 验 概率 。 


18.3.2 ”朴素 贝 叶 斯 分 类 


@ 朴素 贝 叶 斯 分 类 的 原理 

朴素 贝 叶 斯 分 类 基于 条 件 概率 、 贝 叶 斯 公式 和 独立 性 假设 原则 。 

基于 概率 论 的 方法 告诉 我 们 ， 当 只 有 两 种 分 类 时 : 

如 果 P1(x,y)>P2(x,y)， 那 么 分 入 类 别 1; 

如 果 P2(x,y)>P1(x,y)， 那 么 分 入 类 别 2。 

这 里 提 到 的 Pl1(x,y)、P2(x,y) 是 一 种 简化 描述 ， 分 别 表 示 P(cilx,y) 和 P(czlx,y)， 这 些 符 
号 表示 的 意义 可 以 这 样 理解 ,给 定 某 个 由 x、y 两 个 特征 表示 的 数据 点 , 那么 该 数据 点 是 类 
别 ci 的 概率 是 多 少 ? 是 类 别 cz 的 概率 又 是 多 少 ? 应 用 贝 叶 斯 定理 可 得 : 

pe |xy) = PCY Pe) 

p(X,y) 

从 而 可 以 定义 贝 叶 斯 分 类 准则 如 下 : 

。 如 果 p(cilx,y)> p(czlx,y)， 那 么 属于 类 别 cl; 

。 如 果 p(cilx,y)<p(czlx,y)， 那 么 属于 类 别 c。 

这 样 ， 使 用 贝 叶 斯 公式 可 以 通过 计算 已 知 的 3 个 概率 值 来 得 到 未 知 的 概率 值 。 如 果 仅 
仅 为 了 比较 P(cilx, y) 和 P(czlx, y) 的 大 小 ， 因 为 分 母 相同 ， 只 需要 已 知 分 子 上 的 两 个 概率 即 
可 。 这 里 还 有 一 个 假设 ， 就 是 基于 特征 条 件 独立 的 假设 ， 也 就 是 上 面 说 到 的 数据 点 的 两 个 
特征 x 和 y 相互 独立 ， 不 会 相互 影响 ， 因 此 可 以 将 P(x,ylei) 展 开 成 独立 事件 概率 相 乘 的 形 
式 ， 则 有 : 

PGxylc)=PGlc)P(CylcD 

当然 ， 对 于 多 个 特征 条 件 的 情况 ， 上 式 仍然 成 立 ， 这 样 计 算 概率 就 简单 多 了 。 

外 朴素 贝 叶 斯 分 类 的 定义 

扩展 到 一 般 情况 ， 朴 素 贝 叶 斯 分 类 的 正式 定义 如 下 : 

(1) 设 x={a, az …, am} 为 一 个 待 分 类 项 , ai 为 x 的 一 个 特征 属性 , 有 类 别 C={yi, yz,…， 
yaj。 

(2) 计算 p(yilx)，p(y2lx)，…，p(ynlx)。 

(3) 如 果 p(yx|x)=max {p(y1|x), p(y2|X),…, p(yalx)}， 则 xsyk。 

现在 的 关键 是 如 何 计算 第 (2) 步 中 的 各 个 条 件 概率 ， 可 以 这 么 做 : 

@ 找到 一 个 已 知 分 类 的 待 分 类 项 集合 ， 这 个 集合 称 为 训练 样本 集 。 
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@ 统计 得 到 各 类 别 下 各 个 特征 属性 的 条 件 概率 估计 , 即 P(aily1), P(azly1), …, P(amly1); 
Plaily»), P(azly2), **, P(amly2); **; Plailys), P(azlyn), ***, P(amlyn)。 
@ 如 果 各 个 特征 属性 是 条 件 独立 的 ， 则 根据 贝 叶 斯 公式 有 如 下 推导 : 
ply, |x) = P(x |y)P(y;) 
p(X) 
因为 分 母 对 于 所 有 类 别 相 同 ， 所 以 只 要 将 分 子 最 大 化 即 可 。 又 因为 各 特征 属性 是 条 件 
独立 的 ， 所 以 有 : 


P(x| yi)P(yi)=P(a |yi)P(azlyi)4 P(au | yi)P(yi) = POT IPG, yi) 
j=1 


四 朴素 贝 叶 斯 分 类 的 流程 
根据 上 述 分 析 ， 朴 素 贝 叶 斯 分 类 的 流程 可 以 用 图 18-3 表示 。 





准备 阶段 









获取 训练 样本 










确定 特征 属性 


对 每 个 类 别 计 算 
P(y,) 









分 类 器 
训练 阶段 





对 每 个 特征 属性 计算 
所 有 划分 的 条 件 概率 















对 每 个 类 别 计算 
P(xly )P(y.) 


以 P(xly)P(y i) 最 大 
项 作为 x 所 属 类 别 








应 用 阶段 


图 18-3 朴素 贝 叶 斯 分 类 流程 


可 以 看 到 ， 整 个 朴素 贝 叶 斯 分 类 分 为 3 个 阶段 。 

(1) 准备 阶段 : 这 个 阶段 为 朴素 贝 叶 斯 分 类 做 必要 的 准备 ， 主 要 工作 是 根据 具体 应 用 
情况 确定 特征 属性 ， 并 对 每 个 特征 属性 进行 适当 划分 ， 然 后 由 人 工 对 一 部 分 待 分 类 项 进行 
分 类 ， 形 成 训练 样本 集合 。 这 一 阶段 的 输入 是 所 有 待 分 类 数据 ， 输 出 是 特征 属性 和 训练 样 
本 集合 。 这 一 阶段 是 整个 朴素 贝 叶 斯 分 类 中 非常 重要 的 一 个 阶段 ， 也 是 唯一 需要 人 工 完成 
的 阶段 ， 其 质量 对 整个 过 程 有 重要 影响 ， 分 类 器 的 质量 在 很 大 程度 上 由 特征 属性 、 特 征 属 
性 划分 及 训练 样本 质量 决定 。 

(2) 分 类 器 训练 阶段 : 这 个 阶段 就 是 生成 分 类 器 ， 主 要 工作 是 计算 每 个 类 别 在 训练 样 
本 中 的 出 现 概率 及 每 个 特征 属性 划分 对 每 个 类 别 的 条 件 概率 估计 ， 并 将 结果 记录 。 其 输入 
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pe 项 目 案例 开发 
从 入 门 到 实战 一 一 疏 虫 、 游 戏 和 机 器 学 习 
是 特征 属性 和 训练 样本 ， 输 出 是 分 类 器 。 这 一 阶段 是 自动 化 阶段 ， 根 据 前 面 讨论 的 公式 可 
以 由 程序 自动 计算 完成 。 

(3) 应 用 阶段 : 这 个 阶段 的 任务 是 使 用 分 类 器 对 待 分 类 项 进行 分 类 ， 其 输入 是 分 类 器 
和 待 分 类 项 ,输出 是 待 分 类 项 与 类 别 的 映射 关系 。 这 一 阶段 也 是 自动 化 阶段 ， 由 程序 完成 。 


18.3.3 ”使 用 Python 进行 文本 分 类 


在 文本 分 类 中 ， 要 从 文本 中 获取 特征 ， 需 要 先 拆 分 文本 ， 以 一 封 电子 邮件 为 例 ， 电 子 
邮件 中 的 某 些 元 素 构成 特征 。 我 们 可 以 解析 得 到 文本 中 的 词 ， 并 把 每 个 词 作 为 一 个 特征 ， 
而 每 个 词 是 否 出 现 作为 该 特征 的 值 ， 然 后 将 每 一 个 文本 表示 为 一 个 词 条 向 量 ， 就 是 前 面 提 
到 的 词 集 模型 。 每 一 个 文本 的 词 条 向 量 的 大 小 与 词汇 表 中 词 的 数目 一 致 。 

假设 特征 之 间 相 互 独立 。 所 谓 独 立 指 的 是 统计 意义 上 的 独立 ， 即 一 个 特征 或 者 单词 出 
现 的 可 能 性 与 它 和 其 他 单词 相 邻 没有 关系 ， 比 如 说 ,“ 今 天 天 气 真 好 !” 中 的 “今天 ”和 “天 
气 ” 出 现 的 概率 与 这 两 个 词 相 邻 没有 任何 关系 。 这 个 假设 正 是 朴素 贝 叶 斯 分 类 器 中 “朴素 ” 
一 词 的 含义 。 朴 素 贝 叶 斯 分 类 器 中 的 另 一 个 假设 是 每 个 特征 同等 重要 。 
























































18.4 程序 设计 的 步骤 


掌握 了 上 面 的 基本 理论 ， 就 可 以 开启 文本 分 类 之 旅 了 ， 本 节 以 判断 留言 板 的 留言 是 否 
为 侮辱 性 言论 为 例 ， 详 细 讲 解 使 用 朴素 贝 叶 斯 算法 进行 文本 分 类 的 过 程 。 

问题 概述 :构建 一 个 快速 过 滤器 来 屏蔽 在 线 社 区 留言 板 上 的 侮辱 性 言论 。 如 果 某 条 留 
言 中 出 现 了 负面 或 者 侮辱 性 的 词汇 ， 就 将 该 留言 标识 为 内 容 不 当 。 对 此 问题 建立 两 个 类 
别 一 一 侮辱 类 和 非 侮 辱 类 ， 分 别 用 1 和 0 表示 。 

现在 正式 开始 ， 首 先 创 建 一 个 名 为 Nbayes.py 的 新 文件 ， 然 后 依次 将 程序 清单 添加 到 
交 科 中 


18.4.1 ”收集 训练 数据 


为 了 将 主要 精力 集中 在 分 类 算法 本 身 ， 直 接 用 简单 的 英文 语 料 作 为 数 。” 回 守 六 

据 集 。 在 实际 应 用 中 ， 可 以 通过 疏 虫 或 其 他 途径 获取 真实 数据 。 视频 讲解 
def loadDataset () : 

postingList=[['my','dog','has','flea', 'problems', 'help', 'please'], 












n " 下 i 了 wy 了 了 i 站 
Lmaybe not" take Ra to" dog park, SEOD2G 

n i [7 i 了 了 了 了 了 i 页 
Lmy" GadmaEiOnR io "sor "cote ET GOVWe ER 
['stop', 'posting','stupid', 'worthless', 'garbage'], 

P ，B 9 p: 9 9 

| . " " 届 了 WW i wr 
Dimer licks un ater vm toak "hou to ustopu. ham 
[' 


quit', 'buying', 'worthless','dog', 'food','stupid']] 
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classVec=[0,1,0,1,0,1] #1 代表 侮辱 性 言论 ，0 代表 正常 言论 
return postingList,classVec 
loadDataSet() 函 数 直接 用 模拟 的 6 个 已 分 词 的 小 文档 和 对 应 的 6 个 类 别 标签 作为 训练 
数据 。 该 函数 返回 两 个 列表 ， 其 中 postingList 表示 已 分 词 的 文档 列表 ，classVec 表示 文档 
对 应 的 类 别 列表 。 


18.4.2 ”准备 数据 


有 了 数据 集 ， 接 下 来 需要 从 数据 集 生成 文本 的 结构 化 描述 方法 ， 即 向 量 空间 模型 ， 把 
文本 表示 为 一 个 向 量 ， 把 向 量 的 每 个 特征 表示 为 文本 中 出 现 的 词 ， 这 里 用 前 面 提 到 的 词 集 
模型 ， 首 先 遍历 训练 集中 的 所 有 文本 ， 生 成 词汇 表 。 


def vocabList (dataSet) : 
































vocabSet=set([]) # 使 用 set 创建 不 重复 的 词汇 集 
for document in dataset: 
vocabSset=vocabSset | set (document) # 创 建 两 个 集合 的 并 集 


return list (vocabset) 


VocabList(dataSet) 函 数 的 参数 dataSet 为 文档 集 的 单词 列表 ， 即 loadDataSet0 函 数 的 
postingList 返回 值 。 该 函数 根据 文档 数据 集 dataSet 创建 一 个 包含 在 所 有 文档 中 不 重复 出 现 
的 单词 列表 ， 为 此 使 用 Python 的 set 数据 类 型 。 首 先 创建 一 个 空 的 集合 ， 然 后 将 每 个 文档 
的 词 集合 加 入 该 集合 中 ， 操 作 符 “|” 表 示 求 两 个 集合 的 并 集 。 

下 面 根据 词汇 表 生 成 每 篇 文档 的 词 集 模型 表示 ， 即 词 向 量 。 

def setOofWordsVec (vocabList,inputText): 

textVec=[0]*len (vocabList) # 创 建 一 个 所 有 元 素 都 为 0 的 向 量 
# 遍 历 文档 中 的 所 有 单词 ， 若 出 现 了 词汇 表 中 的 单词 ， 则 令 文 档 向 量 中 的 对 应 值 为 1 
for word in inputText: 
if word in vocabList: 
textVec[vocabList.index(word) ]=1 
return textVec 


setOfWordsVec(vocabList,inputText) 函 数 有 两 个 参数 ，vocabList 表示 已 知 的 词汇 表 ， 
inputText 表示 某 一 文档 的 单词 列表 ， 函 数 返 回 值 textVec 为 文档 inputText 的 词 向 量 ， 向 量 
中 的 每 一 元 素 为 0 或 1, 表示 词汇 表 中 的 元 素 在 文档 中 是 否 出 现 , 没有 出 现 为 0, 出现 为 1。 
向 量 的 长 度 与 词汇 表 的 长 度 相同 。 该 函数 首先 创建 一 个 和 词汇 表 一 样 长 的 向 量 ， 向 量 元 素 
全 部 为 0， 接 着 遍历 文档 中 的 每 个 单词 ， 判 断 该 单词 是 否 在 词汇 表 中 ， 如 果 是 ， 就 将 文档 
词 向 量 相 应 位 置 的 元 素 置 为 1 。 


18.4.3 ”分 析 数 据 


现在 可 以 检查 函数 的 执行 情况 ， 首 先 检查 单词 列表 ， 看 有 无 遗漏 或 重复 单词 ， 确 保 数 
据 解析 的 正确 性 。 保 存 Nbayes.py 文件 ， 运 行 该 文件 ， 然 后 在 Python 提示 符 下 输入 : 
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| 项 目 案例 开发 
从 入 门 到 实战 一 一 仆 虫 、 游 戏 和 机 器 学 习 

>>> listOposts,1istClasses=loadDataSset () 

>>> wordList=vocabList (listOposts) 

>>> wordList 

lqog stop" my rp "has. Morthloss "dleks. "mr Wale ME "Loakn 

"please', 'maybe', "help', ‘park’, ‘food’, ‘quit'’, "is', "so', ‘'buying', 

"mover "dalmation,. take "him "POSELing’r how, "stupid, "not 

"flea', "problems",; "garbage', "cute";, “to'"] 

经 检查 没有 遗漏 单词 ， 也 没有 重复 单词 ， 这 样 就 生成 了 共有 32 个 单词 的 词汇 表 。 

下 面 检查 setOfWordsVec() 函 数 的 执行 效果 ， 生 成 第 1 篇 文档 的 词 向 量 : 

>>> setOfWordsVec (wordList,1istOposts[0]) 

[1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 90, 0, 0, 0, 

valoro eo oo 

可 以 看 到 文档 向 量 中 索引 为 0 的 元 素 为 1， 对 应 词汇 表 中 的 dog， 可 以 查看 第 1 篇 文 
档 ['my','dog','has','flea','problems','help','please]， 发 现 单词 dog 果然 出 现 了 。 同 理 ， 将 其 他 
元 素 值 为 1 的 都 验证 一 遍 ， 完 全 正确 。 

下 面 检查 单词 dog 在 第 5 篇 文档 中 是 否 出 现 。 

>>> setOfWordsVec (wordList,1istOposts[4]) 

[0, 1, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 

Te Ooo oo oa 

可 以 看 到 文档 向 量 中 索引 为 0( 对 应 词汇 表 中 的 dog) 的 元 素 为 0, 表示 dog 没有 出 现 ， 
可 以 查看 第 5 篇 文档 [mr','icks','ate','my','steak','how','to','stop','him']， 单 词 dog 果然 没有 出 
现 ， 完 全 正确 。 


18.4.4 ”训练 算法 


现在 已 经 知道 了 一 个 单词 在 一 篇 文档 中 是 否 出 现 ， 也 知道 了 该 文档 所 属 的 类 别 。 接 下 
来 重 写 贝 叶 斯 公式 ， 将 之 前 的 x、y 替换 为 w， 粗 体 的 w 表示 一 个 向 量 ， 即 它 由 多 个 值 组 
成 。 在 这 个 例子 中 ， 数 值 个 数 与 词汇 表 中 的 单词 个 数 相同 。 

Plc, |w) = P(w |c:;)P(c;) 
Pp(W) 

通过 前 面 的 分 析 可 以 知道 ， 需 要 计算 每 个 类 别 的 这 个 概率 值 ， 然 后 选取 概率 最 大 值 对 
应 的 类 别 作为 最 终 的 类 别 。 上 式 中 每 个 类 别 概率 的 分 母 相 等 ， 因 此 只 需要 计算 分 子 的 两 个 
概率 P(ci) 和 P(wlci)。 

首先 通过 类 别 i 侮辱 性 留言 或 者 非 侮 辱 性 留言 》 中 的 文档 数 除 以 总 的 文档 数 来 计算 
概率 P(ci)。 接 下 来 计算 P(wlci)， 这 里 假设 所 有 单词 都 互相 独立 , 将 w 展开 为 一 个 个 独立 的 
特征 (单词 ), 那么 概率 P(wlci) 就 可 以 写 为 P(wo, Wi, W2,…, Walci), 可 以 使 用 P(wolci) P(wilci) 
P(wzlc).….P(walcb) 来 计算 上 述 概率 ， 这 样 计算 过 程 就 简便 多 了 。 

下 面 通过 程序 来 计算 两 种 类 别 下 每 个 单词 的 概率 P(wilco)、P(wilc1) 和 每 个 类 别 的 概率 值 
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P(ci)。 因 为 该 问题 是 二 分 类 问题 ， 类 别 只 有 两 类 ， 因 此 只 要 计算 一 种 类 别 的 概率 如 P(cy)， 
另 一 种 类 别 的 概率 P(co)=1-P(c1)。 

P(c1) 表 示 带 有 侮辱 性 语言 的 文档 的 概率 ， 可 以 用 侮辱 性 文档 数目 除 以 文档 总 数 得 到 。 

P(wilc1) 表 示 侮 辱 性 文档 中 单词 wi 的 条 件 概 率 ， 可 以 用 侮辱 性 文档 中 单词 wi 出 现 的 次 
数 除 以 所 有 侮辱 性 文档 的 单词 总 数 得 到 。 

为 了 简化 程序 的 逻辑 ， 在 计算 过 程 中 用 到 了 Numpy 中 的 一 些 函 数 ， 故 应 确保 导入 
numpy 包 ， 需 要 将 fom numpy import * 语 句 加 在 Nbayes.py 文件 的 最 前 面 。 

















from numpy import * 
def trainNB (trainDocMatrix,trainCategory) : # 训 练 算法 ， 由 词 向 量 计算 概率 
numTrainDoc=len (trainDocMatrix) # 文 档 数 
numWord=len (trainDocMatrix[0]) # 单 词 数 
# 侮 辱 性 文件 的 出 现 概率 ， 即 用 traincategory 中 所 有 的 1 的 个 数 除 以 文档 总 数 
pAbusive=sum(trainCategory) /float (numTrainDoc) 
# 构 造 单词 出 现 的 次 数 数组 ， 初 值 为 0， 大 小 为 单词 数 
PONum=zeros (numWord) 
plNum=zeros (numWord) 
# 整 个 数据 集 单词 出 现 的 总 数 
pODenom=0.0 
plDenom=0.0 
# 对 每 个 文档 遍历 
for i in range (numTrainDoc) : 
# 是 否 为 侮辱 性 文档 
if trainCategory[i]==1: 
# 如 果 是 侮辱 性 文档 ， 对 侮辱 性 文档 的 向 量 进行 求 和 
plNum+=trainDocMatrix[i] 
# 对 向 量 中 的 所 有 元 素 求 和 ， 也 就 是 计算 所 有 侮辱 性 文档 中 出 现 的 单词 总 数 
plDenom+=sum (trainDocMatrix[i]) 
I 
pONum+=trainDocMatrix[i] 
pODenom+=sum (trainDocMatrix[i]) 
# 类 别 1 下 每 个 单词 出 现 的 概率 
plVec=plNum/plDenom 
# 类 别 0 下 每 个 单词 出 现 的 概率 
pOVec=pO0Num/pODenom 
return pOVec,plVec,pAbusive 


trainNBO 函 数 有 两 个 参数 trainDocMatrix 和 trainCategory, 分 别 是 所 有 训练 文档 的 词 向 
量 构成 的 矩阵 和 文档 对 应 的 类 别 标签 数组 , 输出 为 P(wlco) ( 即 p0Vec)、P(wlcD) ( 即 plVec) 
和 P(c) 〈 即 pAbusive) 。 该 函数 首先 计算 P(c1)， 即 文档 属于 侮辱 性 文档 (类 别 为 1) 的 概 
率 ， 用 侮辱 性 文档 数 除 以 文档 总 数 即 可 得 到 。 

计算 p0Vec 和 plVec( 即 P(wlco) 和 P(wlcD)) ， 需 要 计算 每 一 个 单词 在 每 个 类 别 下 的 概 
率 ， 这 里 用 了 Numpy 数组 快速 计算 ，p0Vec 和 plVec 都 是 向 量 ， 大 小 与 词汇 表 相 同 ， 向 量 
中 的 元 素 值 表示 在 相应 类 别 下 对 应 的 词汇 表 中 的 单词 出 现 的 概率 .在 程序 中 pl1Num 首先 用 
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on 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 
Numpy 的 zeros() 初 始 化 为 长 度 与 词汇 表 等 长 的 全 0 数组 ，plDenom 初始 化 为 0。 在 for 循 
环 中 , 遍历 训练 集 的 所 有 文档 ， 如 果 文 档 是 侮辱 性 文档 ,就 将 该 文档 和 plNum 进行 向 量 相 
加 ,并 且 将 该 文档 的 单词 总 数 累加 到 plDenom; 如 果 是 正常 文档 ,也 做 相应 的 处 理 。 这 样 ， 
循环 结束 , plNum 向 量 中 保存 的 是 侮辱 性 文档 中 每 个 单词 出 现 的 次 数 ; p1Denom 保存 的 是 
所 有 侮辱 性 文档 中 出 现 的 单词 总 数 ， 是 一 个 整数 ， 最 后 用 每 个 单词 出 现 的 次 数 除 以 该 类 别 
中 的 单词 总 数 (p1Nump1Denom)， 则 可 以 得 到 每 个 单词 在 该 类 别 下 的 概率 ， 即 P(wilc) 
C0 Dn 

现在 测试 rainNBO 函 数 的 效果 。 将 trainNBO 函 数 的 代码 加 入 Nbayes.py 文件 中 ， 运 行 
该 文件 ， 并 在 Python 提示 符 下 输入 : 

>>> listOposts,1istCclasses=loadDataSset () 


>>> wordList=vocabList (listOposts) 
>>> wordList 


至 此 生成 一 个 包含 所 有 词 的 词汇 表 wordList， 下 面 构建 trainNB() 函 数 所 需要 的 文档 词 
向 量 和 矩阵。 使 用 词 向 量 生成 函数 setOfWordsVec0 循 环 生 成 每 篇 文档 的 词 向 量 ， 填 充 到 
trainDocMat 矩阵 中 ， 可 以 得 到 最 终 的 文档 词 向 量 矩 阵 。 


>>> trainDocMat=[] 
>>> for inDoc in listOposts: 








trainDocMat .append (setOfWordsVec (wordList, inDoc) ) 
>>> trainDocMat 


OL On 0 Er Or Or DO Onn0r Or Or Or On MO Or OD OO Ons 


Chl De 00 0 0 0r Da Te O07 I Or OR 0 O07 0 O07 QF Oy GO OO 
AU 
Or OO Or LO Oi 0 Qn 0 Ll LO 0 QQ 0 OA 
a OO A Or 0 or or TD Or Tel oT O00 0 0 O70r 0 Lt Ol 
1 
0 


[ 

ORR OO OR 1 OO OW a OO OO OO 0 0 
0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1], [1, 0, 0, 0, 1, 0, 0, 0, 
ONO OO OO 0 OO 0 0 OO OO OO OO 


下 面 给 出 侮辱 性 文档 的 概率 和 两 个 类 别 的 概率 向 量 。 


>>> pOV,p1V,PAb=trainNB (trainDocMat, listClasses) 


>>> pAb 

Qs 

>>> pO0V 

array ([0.04166667, 0.04166667, 0.125 ,0.04166667, 0. i 
0.04166667, 0.04166667, 0.04166667, 0.04166667, 0.04166667, 
0.04166667, 0. ，0.04166667，0. OE 
0. ,0.04166667, 0.04166667, 0. ,0.04166667, 
0.04166667, 0. ，0.08333333，0- ，0.04166667， 
0. 0 , 0.04166667, 0.04166667, 0. ' 
0.04166667, 0.04166667]) 

>>> plV 

array ([0.10526316, 0.05263158, 0. ue ,0.10526316, 
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0. 0 Ro 0 oR 
0. ,0.05263158, 0. ,0.05263158, 0.05263158, 
0.05263158,0. 0 ， 0.05263158, 0. 

oR ,0.05263158, 0.05263158, 0.05263158, 0. 
0.15789474, 0.05263158, 0. 0 ，0.05263158， 
0. ，0.05263158]) 


可 以 看 到 ,侮辱 性 文档 的 概率 pAb 为 0.5， 从 训练 数据 可 知 ,一 共有 6 篇 文档 ， 其 中 3 
篇 是 侮辱 性 文档 ， 因 此 该 值 正确 。 下 面 看 看 单词 在 给 定 类 别 下 的 概率 是 否 正 确 ， 词 汇 表 的 
第 1 个 单词 是 dog， 其 在 类 别 0 中 出 现 1 次 ， 而 类 别 0 的 文档 单词 总 数 为 24 个 ， 对 应 的 条 
件 概率 为 124=0.04166667; 在 类 别 1 中 出 现 两 次 ， 类 别 1 的 文档 单词 总 数 为 19 个 ， 对 应 
的 条 件 概率 为 /19=0.10526316， 该 计算 是 正确 的 。 下 面 看 看 两 类 概率 中 的 最 大 值 ， 发 现 是 
plV 中 的 0.15789474， 该 概率 的 索引 为 25， 对 应 词汇 表 中 的 stupid， 意 味 着 该 单词 stupid 
是 最 能 表征 类 别 ( 侮 辱 性 文档 类 ) 的 单词 。 通 过 查看 训练 数据 ， 可 以 发 现 单词 stupid 在 3 
篇 侮辱 性 文档 中 全 部 出 现 了 。 


18.4.5 ”测试 算法 并 改进 


从 上 面 的 测试 结果 可 以 看 到 , 在 p0V 和 plV 中 都 存在 一 些 单词 概率 为 0 的 现象 , 那么 
计算 P(wolci)P(wilci)P(w2lci)…P(wslci) 的 值 肯定 为 0, 这 将 导致 用 朴素 贝 叶 斯 分 类 器 对 文档 分 
类 时 下 面 式 子 中 的 分 子 为 0， 无 法 比较 概率 大 小 ， 最 终 无 法 分 类 。 

pe, |w)= P(w |ci)P(ci) 
p(wW) 

为 了 避免 这 种 现象 ， 可 以 将 所 有 单词 的 出 现 次 数 由 初始 化 为 0 改 为 1， 并 将 plVec= 
plNum/pl1Denom 和 p0Vec =p0Num/p0Denom 中 的 分 母 初始 化 为 2.0，, 确保 分 母 不 为 0。 注 
意 , 这 里 初始 化 为 1 或 2 的 目的 主要 是 为 了 保证 分 子 和 分 母 不 为 0, 大 家 可 以 根据 业务 需 
求 进行 更 改 。 

将 trainNB() 函 数 中 初始 化 的 这 几 条 语句 : 


PONum=zeros (numWord) 



































plNum=zeros (numWord) 
pODenom=0.0 
plDenom=0.0 


修改 为 : 


pONum=ones (numWord) 
plNum=ones (numWord) 
pODenom=2.0 
plDenom=2.0 


另 一 个 需要 注意 的 问题 是 下 溢出 ， 这 是 由 于 很 多 很 小 的 数 相 乘 造成 的 。 当 计算 乘积 
P(wolci)P(wilc)PCwzlc)… 了 PCwalc) 时 ， 由 于 大 部 分 因子 都 非常 小 ,乘积 将 会 变 得 更 小 ， 所 以 可 
会 产生 下 溢出 或 者 得 到 不 正确 的 答案 。 一 种 有 效 的 解决 办 法 是 对 乘积 取 自 然 对 数 。 因 为 
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ln(ab)=ln(a)+ln(b), 于 是 通过 求 对 数 可 以 避免 下 溢出 或 者 浮 点 数 舍 入 导致 的 错误 。 在 数学 上 ， 
fg) 与 In(f(x)) 的 取 值 结果 虽然 不 同 ， 但 在 相同 区 域内 变化 的 趋势 一 致 ， 并 且 在 相同 值 上 取 
到 极 值 。 因 此 ， 采 用 自然 对 数 进行 处 理 不 会 影响 最 终结 果 ， 所 以 将 trainNBO 函 数 中 retum 
前 的 两 行 代码 修改 为 : 


plVec=1o0g (plNum/plDenom) 





pOVec=10g (pONum/pODenom) 


到 现在 为 止 ， 分 类 器 已 经 修改 好 了 ， 下 面 开始 检验 分 类 效果 。 
18.4.6 ”使 用 算法 进行 文本 分 类 


依据 村 素 内 叶 斯 公式 Pe Iw) = 及 前 面 的 分 析 , 只 要 计算 公式 中 的 分 子 即 


可 ， 重 点 是 比较 分 子 的 大 小 ， 分 子 大 的 对 应 的 类 别 就 是 文档 的 类 别 。 将 trainNBO 函 数 求 得 
的 3 个 概率 p0Vec、plVec、pAbusive 及 需要 分 类 文档 的 词 向 量 代 入 公式 , 分 别 比 较 两 种 类 
别 下 的 概率 大 小 ， 即 可 确认 文档 的 类 别 。classifyNBO 函 数 实现 了 上 述 过 程 。 


def classifyNB (textVec,pOVec,plVec,pClassl1): 
分 类 函数 
:param textVec: 要 分 类 的 文档 向 量 
:param p0Vec: 正常 文档 类 (类别 0) 下 的 单词 概率 列表 
:param plVec: 侮辱 性 文档 类 (类别 1) 下 的 单词 概率 列表 
:param pClassl: 侮辱 性 文档 (类别 1) 概率 
:return: 类 别 1 或 0 
P1=sum(textVec*p1Vec)+1og(PClassl) 
P0=sum (textVec*p0Vec)+1og(1.0-pPClassl) 
Print('p1='"vp1) 
print ('p0="',p0) 
if pl>p0: 
return 1 
Sses 


return 0 


为 了 测试 更 加 方便 ， 将 前 面 在 Python 提示 符 下 的 所 有 操作 进行 封装 ， 构 造 测试 函数 
testNB()。 





def testNB(): 井 朴 素 贝 叶 斯 算法 测试 
# (1) 加 载 数 据 集 
listOposts,1istCclasses=loadDataset () 
# (2) 创建 词汇 表 


wordList=vocabList (listOoposts) 
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# (3) 构造 训练 数据 的 文档 词 向 量 矩 阵 

trainDocMat=[] 

for inDoc in listOposts: 
trainDocMat .append (setOfWordsVec (wordList, inDoc)) 

# (4) 训练 数据 

POV, plV, pAb=trainNB (array (trainDocMat) ,array (listclasses)) 

#(5) 测试 数据 

testText=["love', "my', 'ate"] 

thisDoc=array (setOofWordsVec (wordList, testText)) 

print (testText, 'classified as:',classifyNB (thisDoc,pOV,pI1V, pADb)) 

testText=['stupid','dog'] 

thisDoc=array (setOofWordsVec (wordList, testText)) 

print (testText, 'classified as:',classifyNB (thisDoc, pOV,p1V, pAb)) 


将 所 有 函数 保存 到 Nbayes.py 文件 中 ， 运 行 该 文件 ， 并 在 Python 提示 符 下 输入 : 
>>> testNB() 
可 以 看 到 运行 结果 如 下 : 


pl=-9.826714493730215 
pO0=-7.694848072384611 

['love', 'my', "ate'] classified as: 0 
pl=-4.2972854062187915 
p0=-6.516193076042964 

['stupid', 'dog'] classified as: 1 


18.5 ”使 用 朴素 贝 叶 斯 分 类 算法 过 滤 
垃圾 邮件 机 声 计 村 


18.4 节 运 用 朴素 贝 叶 斯 算法 完整 实现 了 社区 留言 板 言论 的 分 类 ， 下 面 将 朴素 贝 叶 斯 算 
法 应 用 于 垃圾 邮件 过 滤 ， 同 样 用 朴素 贝 叶 斯 算法 分 类 的 通用 框架 来 解决 该 问题 。 使 用 朴素 
贝 叶 斯 算法 对 电子 邮件 进行 分 类 的 实现 流程 如 下 。 

(1) 收集 训练 数据 : 提供 已 知 的 文本 文件 。 

(2) 准备 数据 : 将 文本 文件 解析 为 词 向 量 。 

(3) 分 析 数 据 : 检查 词 条 确保 解析 的 正确 性 。 

(4) 训练 算法 : 从 词 向 量 计算 概率 ， 使 用 前 面 建立 的 trainNBO 函 数 。 

(5) 测试 算法 : 使 用 朴素 贝 叶 斯 算法 进行 交叉 验证 。 

(6) 使 用 算法 : 构建 完整 的 程序 对 一 组 邮件 进行 分 类 ， 将 错 分 的 邮件 输出 到 屏幕 上 。 


18.5.1 收集 训练 数据 


假设 训练 数据 已 知 ， 这 里 用 50 封 邮 件 作 为 训练 数据 ， 其 中 垃圾 邮件 和 非 垃 圾 邮件 各 
25 封 。 
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18.5.2 ”将 文本 文件 解析 为 词 向 量 


在 18.4 节 中 , 为 了 着 重 理解 朴素 贝 叶 斯 算法 分 类 的 核心 过 程 , 文本 的 词 向 量 是 预先 给 
定 的 ， 下 面 介绍 如 何 从 文本 构建 自己 的 词 向 量 。 

对 于 一 个 英文 文本 字符 串 ， 可 以 使 用 Python 的 string.split0) 方 法 切 分 。 下 面 看 一 下 实 
际 的 运行 效果 。 在 Python 提示 符 下 输入 : 

















>>> text='In fact, persistence hunting remained in use until 2014, such 
as with the San people of the Kalahari Desert." 
>>> text.split() 


['In', 'fact,', 'persistence', 'hunting', 'remained', 'in', 'use’', 'until', 

"Old "sachr ao “with "Ehers "Santy "poople "DEL Ethos 

'Kalahari', 'Desert.'] 

可 以 看 到 在 默认 情况 下 split0 按 照 单词 之 间 的 空格 进行 切 分 , 整体 切 分 效果 不 错 , 但 美 
中 不 足 的 是 ， 标 点 符号 也 被 当 作 单 词 的 一 部 分 进行 了 切 分 。 可 以 使 用 正则 表达 式 来 切 分 文 
本 ， 其 中 分 隔 符 是 除 单词 、 数 字 以 外 的 任意 字符 串 。 

>>> import re 

>>> regEx=re.compile('\W*') 

>>> wordList=regEx.split (text) 

>>> wordList 

['In', 'fact', 'persistence', 'hunting', 'remained', ‘'in', "use’', 'until', 

2004 MoUch as with ene San Doople", ofr theonr Ralahari, 

"Desert™r 7 

可 以 看 到 标点 符号 没有 了 ， 但 是 多 了 空 字符 串 ， 可 以 计算 字符 串 的 长 度 ， 只 返回 长 度 
大 于 0 的 字符 串 ， 去 掉 空 字符 串 。 这 里 用 列表 推导 式 实 现 : 


>>> [word for word in wordList if len(word)>0] 








['In', 'fact', 'persistence', 'hunting', 'remained’', 'in', 'use’', 'until', 

polan,. "ouch Was ruith, Mthev Pon "paopla of "ther "Kalalari 

'Desert'] 

可 以 看 到 空 字符 串 去 掉 了 ,但 是 英文 句子 的 第 1 个 单词 和 专用 名 词 的 首 字母 是 大 写 的 ， 
为 了 使 所 有 单词 的 形式 统一 ， 将 其 全 部 转换 成 小 写 ， 用 lower() 函 数 即 可 实现 。 

>>> [word.lower() for word in wordList if len(word)>0] 

['in', 'fact', 'persistence', 'hunting', 'remained', 'in', 'use', 'until', 

oOlav, "uch Mas with "Eheor Moan "Pooplony. "oF "Ether "Kalahari 

'desert'] 

另外 ， 在 实际 处 理 中 通常 也 要 过 滤 掉 长 度 小 于 3 的 字符 串 ， 使 得 词汇 表 尽 量 小 一 些 。 

将 上 面 的 文本 处 理 过 程 整理 为 一 个 独立 的 文本 解析 函数 。 


import re 
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def textParse (text): 
regEx=re.compile('\W*"') 
wordList=re.split (regEx, text) 
return [word.lower() for word in wordList if len(word)>2] 


当然 ， 在 实际 应 用 中 文本 解析 是 一 个 相当 复杂 的 过 程 ， 这 里 是 一 种 简单 的 处 理 。 尤 其 
是 中 文 文本 的 解析 ， 由 于 不 像 英 文句 子 中 有 空格 分 隔 ， 要 识别 出 中 文 文本 中 的 词汇 ， 即 中 
文 分 词 本 身 就 是 一 个 值得 研究 的 应 用 领域 。 但 好 在 现在 有 一 些 成 熟 的 支持 Python 的 专门 的 
分 词 模块 ， 这 里 推荐 使 用 jieba 分 词 ， 它 专门 使 用 Python 的 分 词 系统 ， 占 用 的 资源 少 ， 常 
识 类 文档 的 分 词 精度 较 高 ， 对 于 非 专业 文档 绰绰有余 ， 如 果 需 要 可 以 直接 下 载 使 用 。 

现在 将 电子 邮件 文本 传 入 textParse() 函 数 ， 就 可 以 得 到 该 电子 邮件 的 单词 列表 。 

调用 18.4 节 实 现 的 vocabList0 函 数 可 以 生成 所 有 训练 数据 的 词汇 表 。 构建 文档 的 词 向 
量 可 以 用 18.4 节 实 现 的 setOfWordsVec0) 函 数 。 训 练 算法 则 直接 调用 trainNBO 函 数 ， 这 里 
不 再 重复 叙述 。 直 接 用 分 类 算法 进行 邮件 分 类 测试 。 


18.5.3 ”使 用 朴素 贝 叶 斯 算法 进行 邮件 分 类 


这 里 使 用 朴素 贝 叶 斯 算法 对 邮件 进行 分 类 ， 并 进行 交叉 验证 。 交 叉 验 证 也 称 为 循环 估 
计 ， 是 一 种 统计 学 上 将 数据 样本 切割 成 较 小 子 集 的 实用 方法 。 在 给 定 的 建 模样 本 中 ， 拿 出 
大 部 分 样本 进行 建 模 ， 留 小 部 分 样本 用 刚 建立 的 模型 进行 预报 ， 并 求 这 小 部 分 样本 的 预报 

本 例 中 的 样本 数据 共有 50 封 邮件 ， 随 机 选择 10 封 邮件 作为 测试 集 ， 剩 下 的 40 封 邮 
件 作为 训练 集 。 


def spamTest () : 


对 贝 叶 斯 垃圾 邮件 分 类 器 进行 自动 化 处 理 
return: 对 测试 集中 的 每 封 邮件 进行 分 类 ， 若 邮件 分 类 错误 ， 则 错误 数 加 1， 最 后 返回 错 分 率 
emailWordList=[] # 邮 件 的 词 向 量 列表 ， 大 小 与 邮件 数 相同 
classList=[] # 邮 件 的 类 别 标签 列表 
# 这 里 提供 的 训练 邮件 共 50 封 ， 垃 圾 邮件 和 正常 邮件 分 别 25 封 
for i in range(1,26) : 
# 切 分 ， 解 析 数 据 ， 并 归 类 为 1 类 别 
wordList=textParse (open ('email/spam/%d.txt' % i ,encoding="utf-8") 
.read()) 
emailWordList.append (wordList) 










































































classList.append(1) 

# 切 分 ， 解 析 数 据 ， 并 归 类 为 0 类 别 

wordList=textParse (open ('email/nospam/%d.txt' % i ,encoding="utf-8") 
.read()) 

emailWordList.append (wordList) 

classList.append(0) 
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# 创 建 词汇 表 


wordTable=vocabList (emailWordList) 


trainingSet=]1ist (range (50)) 
# 构 造 测试 集 

testSet=[] 

# 随 机 选择 10 封 邮件 用 来 测试 


for i in range(10): 


randIndex=int (random.uniform(0, len (trainingset))) 
testSet .append (trainingSet [randIndex]) 
del (trainingset [randIndex]) 


# 构 造 训 练 集 文 档 词 向 量 年 阵 和 对 应 的 类 别 向 量 


trainDocMat=[] 


trainDocCclass=[] 


for docIndex in trainingSet: 


trainDocMat .append (setOfWordsVec (wordTable, 
emailWordList[docIndex])) 
trainDocClass.append (classList[docIndex]) 


# 用 训练 集 的 邮件 进行 训练 

pOV, plV, pSpam=trainNB (array (trainDocMat) ,array (trainDocClass)) 
errorCount=0 ## 记 录 错 误 邮 件 的 数目 

# 用 测试 集中 的 邮件 进行 分 类 测试 


for docIndex in testSet: 


# 对 每 一 封 邮件 生成 词 向 量 
wordVector=setOfWordsVec (wordTable, emailWordList [docIndex]) 
# 测 试 的 分 类 类 别 与 原 标注 类 别 比较 ， 若 不 相等 ， 说 明 分 类 错误 
if classifyNB (array (wordVector) ,pOV,pl1V,pSpam) != 
classList[docIndex] : 

print ("classification error:",docIndex) 

errorCount+=1 


errRate=float (errorCount/len (testset)) # 错 分 率 
print('the error rate is :', errRate) 
spamTest() 函 数 对 朴素 贝 叶 斯 垃圾 邮件 分 类 器 进行 自动 化 处 理 , 首 先导 入 已 经 整理 好 的 
垃圾 邮件 和 正常 邮件 的 文本 文件 , 分 别 在 文件 夹 spam 与 noSpam 下 ， 并 分 别 对 它们 进行 解 


析 处 理 ，4 





上 成 邮件 的 词 向 量 列表 emailWordList 和 类 别 列表 classList。 调 用 18.4 节 案 例 的 





vocabList() 方 法 ， 可 以 得 到 没有 重复 单词 的 词汇 表 wordTable。 

接 下 来 进行 交叉 验证 ， 需 要 分 别 构建 训练 集 和 测试 集 ， 本 例 中 共有 50 封 邮件 ， 随 机 
选择 10 封 作为 测试 集 ， 剩 下 的 40 封 邮 件 作 为 训练 集 。 那 么 如 何 选择 呢 ? 初始 化 时 
trainingSet= list(range(50))、testSet=[], 可 以 知道 trainingSet 是 一 个 0 一 49 的 整数 列表 ,testSet 
是 一 个 空 列表 。 随 机 函数 random.uniform0) 可 以 生成 一 个 指定 范围 内 的 随机 浮 点 数 ， 


int(random 





.uniform(0,len(trainingSet))) 将 产生 一 个 0 一 49 的 整数 ， 产 生 的 数字 加 入 测试 集 列 


表 testSet 中 ， 同 时 将 该 数字 从 训练 集 trainingSet 中 删除 ， 循 环 10 次 ， 就 随机 产生 了 10 个 
0 一 49 的 整数 ， 整 数 索 引 对 应 的 邮件 作为 测试 集 ， 剩 下 的 40 封 邮件 作为 训练 集 。 
接着 遍历 训练 集中 的 所 有 文档 , 对 每 封 邮件 基于 词汇 表 并 使 用 setOfWordsVecO 函 数 构 
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造 训练 集 的 词 向 量 矩 阵 trainDocMat， 同 时 生成 类 别 向 量 trainDocClass， 并 通过 训练 函数 
trainNBO 计 算出 分 类 所 需要 的 3 个 概率 。 

最 后 遍历 测试 集 ， 对 每 封 邮件 用 classifyNBO 进 行 分 类 ， 与 已 知 的 邮件 类 别 进行 对 比 ， 
如 果 分 类 错误 则 错误 数 加 1， 并 输出 错 分 的 邮件 索引 ， 以 便于 进一步 查验 ， 最 后 给 出 总 的 
错 分 率 。 

下 面 对 上 述 过 程 进 行 测试 ， 将 上 述 所 有 程序 代码 保存 至 Nbayes.py 文件 中 并 运行 ， 在 
Python 提示 符 下 输入 : 

>>> SpamTest () 

the error rate is : 0.0 

>>> SpamTest () 

classification error: 32 


the error rate is : 0.1 


spamTestO 函 数 会 输出 10 封 随机 选择 的 邮件 的 分 类 错误 率 ， 上 面 的 测试 是 运行 两 次 的 
结果 ， 因 为 测试 集 的 10 封 邮 件 是 随机 选择 的 , 每 次 选择 的 测试 集 不 一 定 相同 ， 所 以 每 次 的 
运行 结果 可 能 会 有 些 差 别 。 如 果 有 分 类 错误 ， 会 输出 文档 索引 ， 以 便于 进一步 分 析 错 分 的 
邮件 。 为 了 更 精确 地 估计 错 分 率 ， 需 要 重复 运行 多 次 ， 然 后 求 平均 值 ， 运 行 100 次 ， 获 得 
的 平均 错 分 率 为 3.5%。 


18.5.4 ”改进 算法 


在 前 面 的 算法 中 ， 把 邮件 文本 用 词 集 模型 表示 ， 将 文本 的 每 个 词 作为 一 个 特征 ， 将 词 
是 否 出 现 作为 特征 的 值 。 实 际 上 ， 大 家 经 常见 到 一 个 词 在 一 个 文本 中 多 次 出 现 的 情况 ， 一 
个 词 多 次 出 现 是 否 可 以 比 是 否 出 现 更 加 能 够 表达 某 种 意义 ? 这 种 方法 被 称 为 词 袋 (Bag of 
Words) 模型 。 下 面 来 试 一 试 。 
只 要 将 词 集 模 型 中 的 单词 是 否 出 现 修改 为 出 现 次 数 就 可 以 了 ， 这 样 只 需要 对 
setOfWordsVec() 函 数 做 简单 修改 ， 当 扫描 到 一 个 单词 时 就 将 词 向 量 中 该 单词 的 对 应 值 加 1。 
def bagOofWordsVec (vocabList, inputText): 
textVec=[0]*len (vocabList) # 创 建 一 个 所 包含 元 素 都 为 0 的 向 量 
# 饥 历 文档 中 的 所 有 单词 ， 若 出 现 了 词汇 表 中 的 单词 ， 则 将 文档 向 量 中 的 对 应 值 加 1 


for word in inputText: 























if word in vocabList: 
textVec[vocabList.index (word) ] +=1 
return textVec 


修改 spamTestO 函 数 ， 将 两 处 生成 词 向 量 的 语句 改 为 调用 上 面 的 词 袋 模型 函数 
bagOfWordsVec()， 重 新 执行 spamTestO 函 数 100 次 ， 得 到 的 错 分 率 为 0， 看 来 这 样 修改 后 
确实 可 以 提高 分 类 的 准确 度 。 当 然 ， 在 实际 分 类 中 是 做 不 到 百分之百 正确 的 ， 这 可 能 和 用 
户 选用 的 数据 集 有 关 。 
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从 入 门 到 实战 一 一 怜 虫 、 游 戏 和 机 器 学 习 


ld 


Scikit-Leam 是 一 个 用 于 机 器 学 习 的 Python 库 ， 建 立 在 Numpy、Scipy 和 Matplotlib 基 
础 之 上 。 它 提供 了 机 器 学 习 常用 的 算法 模块 ， 例 如 监督 学 习 、 无 监督 学 习 、 模 型 选择 和 评 
估 、 数 据 集 转换 等 ， 在 监督 学 习 模块 中 包含 机 器 学 习 常用 的 分 类 算法 ， 例 如 朴素 贝 叶 斯 、 
KNN、 决 策 树 、 支 持 向 量 机 等 。 

Scikit-Learn 的 官方 网 站 “http://scikit-learn.org” 是 学 习 和 应 用 机 器 学 习 算法 的 最 重要 
的 工具 之 一 ， 以 朴素 贝 叶 斯 算法 为 例 ， 网 站 提供 了 一 整套 算法 学 习 的 教程 和 资源 ， 网 址 为 
“http://scikit-learn.org/stable/modules/naive_bayes.html”。 

如 果 要 安装 Scikit-Leam， 需 要 先 安装 Numpy、Scipy 和 Matplotlib， 直 接 用 pip install 
命令 安装 : 


pip install numpy 

















pip install scipy 
pip install matplotlib 
pip install scikit-learn 


本 节选 择 Scikit-Learn 的 朴素 贝 叶 斯 算法 进行 文本 分 类 ， 对 18.4 节 和 18.5 节 的 例子 重 
新 进行 实现 。 

用 Scikit-Leam 的 朴素 贝 叶 斯 算法 进行 文本 分 类 包含 以 下 几 个 步骤: 

(1) 收集 样本 数据 。 

(2) 提取 文本 特征 : 生成 文本 的 向 量 空间 模型 。 

(3) 训练 分 类 器 。 

(4) 在 测试 集 上 进行 测试 。 

(5) 分 类 结果 评估 。 


18.6.1 文本 分 类 常用 的 类 和 函数 


@@ load_files0 函 数 视频 讲解 

该 函数 位 于 sklearmn.datasets 模块 下 ， 功 能 是 加 载 文 本 文件 ， 将 二 层 文件 夹 名 字 作 为 分 
类 类 别 。Scikit-Learn 本 身 也 自 带 了 一 些 数 据 集 ， 可 以 供用 户 学 习 测试 使 用 ， 一 般 通 过 
sklearn.datasets 模块 下 的 其 他 函数 加 载 使 用 。 


sklearn.datasets.load files(container path, description=None, 
categories=None, load content=True, shuffle=True, encoding=None, 








decode error="'strict', random state=0) 

主要 参数 如 下 。 

。 container path: 文件 夹 的 路 径 。 

。 load_content: 是 否 把 文件 中 的 内 容 加 载 到 内 存 ， 该 项 为 可 选项 ， 默 认 值 为 True。 
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。 encoding: 编码 方式 。 当 前 文本 文件 的 编码 方式 一 般 为 “utf-8”， 如 果 不 指明 编码 方 
式 (encoding=None), 那么 文件 内 容 将 会 按照 bytes 处 理 , 而 不 是 按照 unicode 处 理 ， 
其 默认 值 为 None。 

该 函数 的 返回 值 为 Bunch 对 象 ， 主 要 属性 如 下 。 

。 data: 原始 数据 。 

。 filenames: 每 个 文件 的 名 字 。 

。 target: 类 别 标签 〈 从 0 开始 的 整数 索引 )。 

。 target names: 类 别 标签 的 具体 含义 〈 由 子 文件 夹 的 名 字 决 定 )。 

注意 : 需要 将 数据 组 织 成 如 下 文件 结构 ， 有 几 种 类 别 就 有 几 个 子 文件 夹 ， 当 然 文件 夹 

及 文件 的 名 字 可 以 自 定 义 。 


container folder/ 








category 1 folder/ 

fille LT.ExE Eiler 2 taE .0 Efile 42.Ext 
category 2 folder/ 

Eile ren 


例如 在 垃圾 邮件 过 滤 例 子 中 ，email 文件 夹 下 的 二 级 文件 夹 spam 和 noSpam 将 作为 类 
别 标签 。 

四 train_test_split0 函 数 

该 函数 位 于 skleam.model_selection 模块 下 , 能 够 从 样本 数据 随机 按 比例 选取 训练 子 集 
和 测试 子 集 ， 并 返回 划分 好 的 训练 集 测试 集 样本 和 训练 集 测试 集 标签 。 

sklearn.model selection.train test split(train data,train target, 

test size, random state) 


参数 如 下 。 
train_data: 被 划分 的 样本 特征 集 。 
train_target: 被 划分 的 样本 标签 。 
test_size: 如 果 是 0 一 1 的 浮 点 数 ， 表 示 样 本 占 比 ， 如 果 是 整数 ， 则 是 样本 的 数量 ， 
该 项 为 可 选项 ， 默 认 值 为 None。 
Iandom state: 随机 数 的 种 子 , 不同 的 种 子 会 造成 不 同 的 随机 采样 结果 ,相同 的 种 子 
采样 结果 相同 ， 该 项 为 可 选项 ， 默 认 值 为 None。 

© CountVectorizer 类 

该 类 是 文本 特征 提取 模块 sklearn.feature_extraction.text 下 的 一 个 常用 的 类 ， 能 够 将 文 
档 词 块 化 ， 并 进行 数据 预 处 理 ， 例 如 去 音调 、 转 小 写 、 去 停 用 词 ， 最 后 生成 文档 的 词 频 算 
阵 ， 即 前 面 所 说 的 词 袋 模型 。 


class sklearn.feature extraction.text.CountVectorizer (input=u'content', 
encoding=u'utf-8', decode error=u'strict',strip accents=None, lowercase 

















=True, preprocessor=None, tokenizer=None, stop words=None,token pattern 
=u' (2u) \b\W\w+\b', ngram range=(1, 1), analyzer=u'word', max df=1.0,min 
df=1,max features=None, vocabulary=None, binary=False, dtype=<type ‘numpy. 
int64"'>) 
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其 参数 很 多 ， 这 里 介绍 最 常用 的 几 个 ， 其 他 用 默认 值 即 可 。 
。 stop words: 设置 停 用 词 ， 可 以 为 english、list 或 None (默认 值 )， 设 为 english 将 
使 用 内 置 的 英语 停 用 词 , 设 为 一 个 list 可 自 定 义 停 用 词 , 设 为 None 则 不 使 用 停 用 词 ， 
设 为 None 且 max dfe[0.7, 1.0) 将 自动 根据 当前 的 语料库 建立 停 用 词 表 。 
lowercase: 是 否 将 所 有 字符 转变 成 小 写 ， 默 认 值 为 True。 
token_ pattern: 表示 token 的 正则 表达 式 ， 只 有 当 analyzer 一 'word' 时 才 使 用 ， 默 认 
的 正则 表达 式 选 择 两 个 及 以 上 的 字母 或 数字 作为 token, 标点 符号 默认 当 作 token 分 
隔 符 ， 而 不 会 被 当 作 token。 
analyzer: 一 般 使 用 默认 值 , 可 设置 为 string 类 型 {'word', 'char', 'char wb" 或 callable， 
特征 基于 wordn-grams 或 character n-grams。 

。 decode_error: 默认 为 strict， 若 遇 到 不 能 解码 的 字符 将 报 UnicodeDecodeError 错误 ， 

设 为 ignore 将 会 忽略 解码 错误 。 

CountVectorizer 类 的 核心 函数 是 fit_transform()， 通 过 该 函数 能 够 学 习 词 汇 表 ， 返 回 文 

档 的 词 频 矩 阵 。 


fit transform(raw documents, y=None) 


其 参数 raw_documents 为 迭代 器 ， 可 以 是 str、unicode 或 文件 对 象 。 

其 返回 值 是 文档 的 词 频 和 矩阵， 矩阵 大 小 为 文档 数 x 特 征 数 。 

@ MultinomialNB 类 

在 Scikit-Leam 中 共有 3 个 朴素 贝 叶 斯 的 分 类 算法 类 ， 分 别 是 GaussianNB 、 
MultinomialNB 和 BernoulliNB。 其 中 ，GaussianNB 是 先 验 概率 为 高 斯 分 布 的 朴素 贝 叶 斯 ， 
MultinomialNB 是 先 验 概率 为 多 项 式 分 布 的 朴素 贝 叶 斯 ， BemoulliNB 是 先 验 概率 为 伯 努 
利 分 布 的 朴素 贝 叶 斯 。 

这 3 个 类 适用 的 分 类 场景 不 同 ， 一 般 来 说 ， 如 果 样 本 特征 的 分 布 大 部 分 是 连续 值 ， 使 
用 GaussianNB 会 比较 好 ; 如 果 样 本 特征 的 分 布 大 部 分 是 多 元 离散 值 ， 使 用 MultinomialNB 
比较 合适 ， 如 果 样 本 特征 是 二 元 离散 值 或 者 很 稀 玻 的 多 元 离散 值 ， 应 该 使 用 BernoulliNB。 
因为 考虑 文本 分 类 中 的 特征 是 离散 的 单词 ， 所 以 用 MultinomialNB。 


class sklearn.naive bayes.MultinomialNB (alpha=1.0,fit prior=True,class 














prior=None) 


参数 如 下 。 

。 alpha: 拉 普 拉 斯 平滑 参数 ， 是 一 个 大 于 0 的 常数 ， 该 项 为 可 选项 ， 默 认 值 为 1。 

。 fit_ prior: 是 否 要 考虑 先 验 概率 ， 如 果 是 False， 则 所 有 的 样本 类 别 输出 都 有 相同 的 
类 别 先 验 概率 ， 该 项 为 可 选项 ， 默 认 值 为 True。 

。 class_prior: 类 别 的 先 验 概率 ， 该 项 为 可 选项 ， 默 认 值 为 None。 

MultinomialNB 类 下 有 两 个 核心 函数 。 

(1) fit0 函 数 : 拟 合 朴素 贝 叶 斯 分 类 器 。 


fit(X, y, sample weight=None) 
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参数 如 下 。 

。 义 : 训练 数据 的 词 频 和 矩阵 。 

。y: 训练 数据 的 类 别 标签 向 量 。 

其 返回 值 为 MultinomialNB 对 象 。 

(2) predictO 函 数 : 对 测试 集 进行 分 类 。 


predict (Xx) 


参数 X 为 要 分 类 的 文档 的 词 频 和 矩阵 ， 和 矩阵 大 小 为 测试 集中 的 文档 数 x 特 征 数 。 

其 返回 值 为 X 的 预测 目标 值 向 量 ， 向 量 大 小 与 测试 集中 的 文档 数 一 致 。 

@Q@ dlassification_report0 函 数 

该 函数 位 于 sklearn.metrics 模块 下 ， 用 于 显示 主要 分 类 指标 的 文本 报告 ， 在 报告 中 显 








示 每 个 类 的 准确 率 、 召 回 率 、F1 值 等 信息 。 


sklearn.metrics.classification reportl(y true, y pred, labels=None, 
target names=None, sample weight=None, digits=2) 

主要 参数 如 下 。 

。 y_true: 一 维 数组 ， 或 标签 指示 器 数组 / 稀 疏 和 矩阵， 目标 值 。 

。y_pred: 一 维 数组 ， 或 标签 指示 器 数组 /稀疏 和 矩阵， 分 类 器 返回 的 估计 值 。 

。 labels: 一 维 数组 ， 报 表 中 包含 的 标签 索引 列表 ， 可 选 。 

。 target_names: 字符 串 列 表 ， 与 标签 匹配 的 显示 名 称 ， 可 选 。 

。 sample weight: 一 维 数组 ， 样 本 权重 ， 可 选 。 

。 digits: int 型 ， 输 出 浮 点 值 的 位 数 ， 可 选 。 

其 返回 值 为 每 类 文本 的 准确 率 、 召 回 率 、F1-score 等 信息 ，string 类 型 。 

对 于 数据 测试 结果 有 下 面 4 种 情况 。 

TP: 预测 为 正 ， 实 际 为 正 ，FP: 预测 为 正 ， 实 际 为 负 ; FN: 预测 为 负 ， 实 际 为 正 ; 
: 预测 为 负 ， 实 际 为 负 。 

关于 准确 率 、 召 回 率 、F1-score， 详 细 定 义 如 下 : 

准确 率 =TP/ (TP+FP) 

召回 率 =TP/ (TP+FN) 

Fl-score= 2xTP/(2xTP + FP + FN) 

熟悉 了 这 些 类 和 函数 的 使 用 ， 就 可 以 实现 具体 的 案例 了 。 























18.6.2 ”案例 实现 


创建 一 个 名 为 skleam_NB.py 的 新 文件 , 用 Scikit-Learn 库 的 朴素 贝 叶 斯 算法 将 18.4 节 


和 18.5 节 的 例子 重新 进行 实现 。 


from sklearn import datasets 

from sklearn.feature extraction.text import CountVectorizer 

from sklearn.naive bayes import MultinomialNB # 导 入 多 项 式 贝 叶 斯 算法 包 
from sklearn.cross validation import train test split 
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from sklearn.metrics import classification report 
# 留 言 板 案例 的 Scikit-Learn 实现 
def testNB skl() : 
posting=['my dog has flea problems help please', 'maybe not take him to 
dog park stupid', 
"my dalmation is so cute I love him','stop posting stupid 
worthless garbage', 
"mr licks ate my steak how to stop him', 'quit buying worthless 
dog food stupid'] 
classVec=[0,1,0,1,0,1] 
# 交 叉 验证 选择 训练 集 和 测试 集 
train data,test data,train y,test y=train test split(posting, 
classVec, test size=0.2,train size=0.8) 
# 生 成 文本 的 词 频 和 矩阵 
vectorizer=CountVectorizer () #CountVectorizer 用 于 词 袋 模型 统计 词 频 
WordX=vectorizer.fit transform(train data) 
# 训 练 分 类 器 
clf=MultinomialNB() .fit (wordx, train y) 
# 预 测 测试 集 的 分 类 结果 
test wordxX=vectorizer.transform(test data) .toarray() 
predicted=clf.predict (test wordx) # 预 测 
for doc,category in zip(test data,predicted): 
print (doc,":",category) 
# 在 测试 集 上 的 性 能 评估 
classTarget_names=[ "正常 言论 '，' 侮 辱 性 言论 '] 
print (classification report (test y,predicted,target names= 
classTarget names)) 
# 垃 圾 邮件 过 滤 的 Scikit-Learn 实现 
def spamTest skl1() : 
# 加 载 email 文件 夹 下 的 数据 
base data=datasets.load files ("email/") 
# 交 叉 验证 选择 训练 集 和 测试 集 
train data,test data,train y,test y= 
train test split (base data.data,base data.target, test size= 
0.2,train size=0.8) 
# 生 成 文本 的 词 频 矩 阵 
Vectorizer=CountVectorizer (stop words="english", 
decode error='ignore') 
wordX=vectorizer.fit transform(train data) 
# 训 练 分 类 器 
clf=MultinomialNB() .fit (wordx, train y) 
# 预 测 测 试 集 的 分 类 结果 
test wordx=vectorizer :transform(test data) .toarray() 
#newDoc tfidf=trans former.transform (newDoc wordx) 
# 得 到 新 文档 每 个 词 的 TF-IDF 值 
predicted=clf.predict (test wordx) # 预 测 
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print (predicted) 
# 在 测试 集 上 的 性 能 评估 
print (classification report (test y,predicted,target names= 
base data.target names)) 
运行 skleam_NB.py， 在 Python 提示 符 下 输入 testNB_skl0， 可 以 得 到 留言 是 否 为 侮辱 
言论 的 预测 分 类 结果 及 预测 评估 报告 : 


maybe not take him to dog park stupid : 0 





quit buying worthless dog food stupid : 1 
precision recall fl-score support 


正常 言论 0.00 0.00 0.00 0 
侮辱 性 言论 To 0.50 0.67 2 
avg/total 1.00 0.50 0.67 加 


在 Python 提示 符 下 输入 spamTest_skl0， 可 以 得 到 垃圾 邮件 过 滤 的 预测 分 类 结果 及 预 
测评 估 报 告 : 
[| 
precision recall fl-score support 


noSpam 00 1.00 T=00, 6 
spam 1.00 1.00 00 4 
avg/total 1.00 1.00 1.00 10 


注意 : 因为 训练 集 和 测试 集 是 随机 划分 的 ， 所 以 每 次 的 运行 结果 不 一 定 相 同 。 
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19.1 手写 体 识别 案例 需求 


人 类 对 图 19-1 所 示 的 一 串 手 写 图 像 可 以 毫 不 费力 地 认 出 是 504192, 这 
是 因为 人 体 的 视觉 系统 相当 神奇 ， 但 是 让 计算 机 进行 识别 就 比较 复杂 了 。 
假如 给 定 一 个 数字 5 的 图 像 ， 计 算 机 如 何 描述 出 这 是 一 个 数字 5 呢 ? 我 们 
可 以 把 计算 机 当 作 一 个 小 孩子 ， 让 它 见 很 多 的 5 的 图 片 ， 慢 慢 就 形成 
了 自己 的 判断 标准 ， 而 这 种 让 计算 机 学 习 的 方法 就 是 神经 网 络 , 深度 人 OU/ 4 又 
学 习 (Deep Learning) 就 是 具有 多 隐 含 层 的 神经 网 络 结构 。 

本 章 案例 将 采用 深度 学 习 框架 ， 使 用 卷 积 神经 网 络 (CNN) 对 图 19-1 手写 体 数 字 
MNIST 数据 集 进行 训练 ,最 终 给 计算 机 一 个 任意 书写 的 手写 体 数字 ,使 它 能 够 识别 出 该 数 
字 是 什么 。 


19.2 ”深度 学 习 的 概念 及 关键 技术 


深度 学 习 (Deep Learming) 是 机 器 学 习 (Machine Leaming) 研究 中 的 一 个 新 领域 ， 是 
具有 多 隐 含 层 的 神经 网 络 结构 。 


19.2.1 神经 网 络 模型 


@ 生物 神经 元 
大 脑 大 约 由 140 亿 个 神经 元 组 成 ， 神 经 元 互相 连接 成 神经 网 络 ， 每 个 神经 元 平均 连接 
几 千 条 其 他 神经 元 。 神 经 元 是 大 脑 处 理 信息 的 基本 单元 ,一 个 神经 元 的 结构 如 图 19-2 所 示 。 
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Dendrites (receiving end) 树 突 〔 信 号 接收 端 ) 






轴 突 终端 


Terminal buttons 


Nucleus 细 胞 核 
Cytoplasm 细 胞 质 





Nodes of Ranvier 
Hyelin sheath Ranvier 结 
轴 突 保护 层 


图 19-2 生物 神经 元 结构 


可 以 看 到 ， 一 个 可 视 化 的 生物 神经 元 是 由 细胞 体 、 树 突 和 轴 突 三 部 分 组 成 。 以 细胞 体 
为 主体 ， 由 许多 向 周围 延伸 的 不 规则 树枝 状 纤维 构成 ， 其 形状 像 一 棵 枯 树 的 枝 干 。 其 中 ， 
轴 突 负责 细胞 体 到 其 他 神经 元 的 输出 连接 ， 树 突 负责 接收 其 他 神经 元 到 细胞 体 的 输入 。 来 
自 神经 元 〈 突 触 〉 的 电化 学 信号 聚集 在 细胞 核 中 ， 如 果 聚 合 超过 了 突 触 闪 值 ， 那 么 电化 学 
尖峰 〈 突 触 ) 就 会 沿 着 轴 突 向 下 传播 到 其 他 神经 元 的 树 突 上 。 

由 于 神经 元 结构 的 可 塑性 ， 突 触 的 传递 作用 可 增强 或 减弱 ， 因 此 神经 元 具有 学 习 与 遗 
忘 的 功能 。 

四 人 工 神经 网 络 

人 工 神经 网 络 是 反映 人 脑 结构 及 功能 的 一 种 抽象 数据 模型 ， 它 使 用 大 量 的 人 工 神经 元 
进行 计算 ， 该 网 络 将 大 量 的 “神经 元 ”相互 连接 ， 每 个 “神经 元 ”是 一 种 特定 的 输出 函数 ， 
又 称 为 激活 函数 。 每 两 个 “神经 元 ”之 间 的 连接 都 通过 加 权 值 ， 称 为 权重 ， 这 相当 于 人 工 
神经 网 络 的 记忆 。 网 络 的 输出 则 根据 网 络 的 连接 规则 来 确定 ， 输 出 因 权 重 值 和 激励 函数 的 
不 同 而 不 同 。 
一 个 简单 的 人 工 神 经 网 络 如 图 19-3 所 示 ， 其 中 ，xi(D 等 数据 为 这 个 神经 元 的 输入 ， 代 
表 其 他 神经 元 或 外 界 对 该 神经 元 的 输入 ; oa 等 数据 为 这 个 神经 元 的 权重 ，u = > oj :xj(t) 














是 对 输入 的 求 和 ; y(t) =f(ui(t)) 称 为 激励 函数 , 是 对 求 和 部 分 的 再 加 工 , 也 是 最 终 的 输出 。 
因此 , 神经 网 络 就 是 将 许多 单一 的 神经 元 连接 在 一 起 的 一 个 典型 的 网 络 , 如 图 19-4 所 
示 ， 用 更 多 的 神经 元 去 进行 学 习 ， 神 经 网 络 最 左边 的 一 层 叫 输入 层 ， 它 有 3 个 输入 单元 ; 
最 右边 的 一 层 叫 输出 层 ， 它 只 有 一 个 结 点 ; 中 间 两 层 称 为 隐藏 层 ， 因 为 用 户 不 能 在 训练 过 
程 中 观测 到 它们 的 值 。 其 实 ， 神 经 网 络 可 以 包含 更 多 的 隐藏 层 。 


19.2.2 ”深度 学 习 之 卷 积 神经 网 络 


深度 学 习 的 概念 源 于 人 工 神经 网 络 的 研究 ， 含 有 多 隐 层 的 神经 网 络 就 
是 一 种 深度 学 习 结 构 。 深 度 学 习 通 过 组 合 低 层 特征 形成 更 加 抽象 的 高 层 表 
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示 属 性 类 别 或 特征 ， 以 发 现 数据 的 分 布 式 特征 表示 。 
XI(D 


w(t) 
xs(t) 


xX4(t) 








xs(t) 


图 19-3 人工 神经 网 络 图 19-4 神经 网 络 典型 结构 


深度 学 习 中 的 卷 积 神经 网 络 (CNN) 近年 来 有 了 非常 出 色 的 表现 ， 它 与 普通 的 神经 网 
络 的 区 别 在 于 包含 了 一 个 由 卷 积 层 和 池 化 层 构成 的 特征 抽取 器 。 在 卷 积 神经 网 络 的 卷 积 层 
中 ， 一 个 神经 元 只 与 部 分 邻 层 神经 元 相连 接 ， 通 常 包含 若干 个 特征 图 (Feature Map)， 每 
个 特征 平面 由 一 些 和 矩形 排列 的 神经 元 组 成 。 同 一 特征 平面 的 神经 元 共享 权 值 ， 这 里 共享 的 
权 值 就 是 卷 积 核 ， 卷 积 核 一 般 以 随机 小 数 和 矩阵 的 形式 初始 化 ， 在 网 络 的 训练 过 程 中 卷 积 核 
将 学 习 得 到 合理 的 权 值 。 共 享 权 值 〈 卷 积 核 ) 带 来 的 直接 好 处 是 减少 了 网 络 各 层 之 间 的 连 
接 ， 同 时 又 降低 了 过 拟 合 的 风险 。 池 化 也 叫 子 采 样 ‘Pooling)， 可 以 看 作 一 种 特殊 的 卷 积 
过 程 。 卷 积 和 池 化 大 大 简化 了 模型 复杂 度 ， 减 少 了 模型 的 参数 。 

下 面具 体 介绍 几 个 相关 概念 。 

@ 卷 积 

这 里 用 一 个 简单 的 例子 来 讲述 如 何 计算 卷 积 ， 假 设 有 一 个 5x5 的 图 像 ， 使 用 一 个 3x3 
的 卷 积 核 (filter) 进行 卷 积 ， 想 得 到 一 个 3x3 的 Feature Map， 首 先 对 图 像 的 每 个 像素 进行 
编号 ， 用 xij 表 示 图 像 的 第 i 行 第 j 列 元 素 ， 对 filter 的 每 个 权重 进行 编号 ， 用 wm 表示 第 
m 行 第 n 列 的 权重 ， 对 Feature Map 的 每 个 元 素 进行 编号 ， 用 aij 表示 第 i 行 第 j 列 元 素 。 

那么 Feature Map 中 aoo 的 卷 积 计算 方法 如 下 ， 如 图 19-5 所 示 。 


image 5x5 filter 3x3 Feature Map3x3 


























图 19-5 卷 积 原理 图 1 


a0.0 =O0.0X0.0t 0.1X0,1+ O02X0.2+ O10X1.0+OLIXLIT O21.2+02.0X2.0+02.1X2.1+02.2X2.2 
=]x]l+0x]l+]x1+0x0+1x1+0x1+]x0+0x0+]x1 
=4 
Feature Map 中 ao 的 卷 积 计算 方法 如 下 ， 如 图 19-6 所 示 。 
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a0.1—O0.1X0.1+ 0,2X0.2+0.3X0.3+O11X1.1+ O12X1.2+O1.3X1.3+02.1X2.1+02 2X2.2+02.3X2.3 
=]xl1+0x]l+]x0+0x1+]1x1+0x1+]1x0+0x1+]x1 
= 





bias=0 


image 5x5 filter 3x3 Feature Map 3x3 
图 19-6 卷 积 原理 图 2 


同 理 ， 依 次 计算 出 Feature Map 中 所 有 元 素 的 值 。 

在 上 面 的 计算 过 程 中 ， 步 幅 (stride) 为 1， 步 幅 可 以 设 为 大 于 1 的 数 。 例 如 ， 当 步 幅 
为 2 时 filter 将 每 次 滑动 两 个 元 素 ， 因 此 Feature Map 就 变 成 了 2x2。 这 说 明 图 像 大 小 、 步 
幅 和 卷 积 后 的 Feature Map 大 小 是 有 关系 的 ， 这 里 将 不 再 举例 。 

上 例 仅 演示 了 一 个 filter 的 情况 ， 其 实 每 个 卷 积 层 可 以 有 多 个 filter， 每 个 filter 和 原始 
图 像 进行 卷 积 后 都 可 以 得 到 一 个 Feature Map， 因 此 卷 积 后 Feature Map 的 深度 (个 数 ) 和 
卷 积 层 的 filter 个 数 是 相同 的 。 图 19-7 所 示 为 3 个 24x24 大 小 的 filter( 即 3x24x24) 得 到 
的 三 维 的 Feature Map。 


28x28 input neurons first hidden layer: 3x24x24 neurons 











图 19-7 多 个 卷 积 核 
以 上 就 是 卷 积 层 的 计算 方法 ， 这 里 体现 了 局 部 连接 和 权 值 共享 : 每 层 神 经 元 只 和 上 一 
层 部 分 神经 元 相连 〈 卷 积 计 算 规 则 )， 且 filter 的 权 值 对 于 上 一 层 所 有 神经 元 都 是 一 样 的 。 
@ 池 化 (Pooling ) 
Pooling 层 的 主要 作用 是 下 采样 ， 通 过 去 掉 Feature Map 中 不 重要 的 样本 进一步 减少 参 
数 数量 ， 且 可 以 有 效 地 防止 过 拟 合 。Pooling 的 方法 很 多 ， 最 常用 的 是 最 大 池 化 (Max 
Pooling)。 最 大 池 化 实际 上 就 是 在 nxn 的 样本 中 取 最 大 值 ， 作 为 采样 后 的 样本 值 。 
图 19-8 是 2x2 步 幅 为 2 的 最 大 池 化 ， 即 在 获取 的 Feature Map 中 每 2x2 的 矩阵 内 取 最 
大 值 作为 采样 后 的 结果 ， 这 样 能 把 数据 缩小 至 1/4， 同 时 又 不 会 损失 太 多 信息 。 
对 于 深度 为 D 的 Feature Map， 各 层 独 立 做 Pooling， 因 此 Pooling 后 的 深度 仍然 为 D。 
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Max(1,1,5,6)=6 


max pool with 2x2 filters 
and stride 2 





Rectified Feature Map 


图 19-8 池 化 


@ 激活 函数 

激活 函数 的 作用 是 能 够 给 神经 网 络 加 入 一 些 非 线性 因素 , 使 得 神经 网 络 可 以 更 好 地 解决 较 
为 复杂 的 问题 。 常 见 的 激活 函数 有 Sigmoid0、tanh0、ReLUO 等 ， 这 里 简要 介绍 两 个 常用 的 
函数 Sigmoid0 和 ReLUO。 

1) Sigmoid0 函 数 

其 表达 式 如 下 : 





8(2)= l+e™ 


其 中 ，z 是 一 个 线性 组 合 ， 比 如 z 可 以 等 于 wo + wixxi + wz2xxz。 通 过 代入 很 大 的 正 数 或 很 
小 的 负数 到 函数 中 可 知 ，g(z) 的 结果 趋 近 于 0 或 1。 
因此 ，Sigmoid0 函 数 的 图 形 表示 如 图 19-9 所 示 。 
也 就 是 说 ，Sigmoid() 函 数 的 功能 是 把 一 个 实 
数 压缩 至 0 一 1。 当 输入 非常 大 的 正 数 时 ， 输 出 结 
果 会 接近 1; 当 输 入 非常 大 的 负数 时 ， 则 会 得 到 
接近 0 的 结果 。 压 缩 至 0 一 !1 的 作用 是 可 以 把 激活 
函数 看 作 一 种 “分 类 的 概率 ” 比如 激活 函数 的 输 
出 为 0.9， 便 可 以 解释 为 90% 的 概率 为 正 样本 。 
2) ReLUO 函 数 
0 (x<0) 图 19-9 ”Sigmoid0 函 数 图 形 
= (x>0) 


在 ReLUO 函 数 中 , 当 x<0 时 函数 值 为 0, 否则 仍 为 x*ReLUO 函 数 的 图 形 表示 如 图 19-10 
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所 示 。 





图 19-10 ReLUO 函 数 图 形 


与 Sigmoid() 和 ReLUO 函 数 相 比 ，Sigmoid0) 函 数 在 输入 参数 太 大 或 太 小 时 ， 会 产生 梯 
度 消 失 现象 ， 而 ReLUO 对 于 随机 梯度 下 降 的 收敛 有 巨大 的 加 速 作用 ， 且 ReLUO 只 需要 一 
个 阔 值 就 可 以 得 到 激活 值 ， 而 不 用 进行 一 大 堆 复杂 的 〈 指 数 ) 运算 。 但 ReLU() 的 缺点 是 ， 
它 在 训练 时 比较 脆弱 ， 容 易 形成 不 可 逆转 的 死亡 ， 导 致 了 数据 多 样 化 的 丢失 。 

@ 卷 积 神经 网 络 的 网 络 结 

一 个 卷 积 神经 网 络 通常 由 若干 卷 积 层 、Pooling 层 、 全 连接 层 组 成 。 用户 可 以 构建 各 种 
不 同 的 卷 积 神经 网 络 。 图 19-11 所 示 为 一 个 常见 的 卷 积 神经 网 络 模型 。 


cl sl C2 S2 





Input 






Output 





Convolution Full 


Convolution Pooling Pooling Comnscted 


+ReLU +ReLU 
图 19-11 一 个 典型 的 CNN 网 络 结构 


其 中 ，Input 为 输入 图 像 ， 被 计算 机 理解 为 矩阵 ， 输 入 图 像 通 过 6 个 可 训练 的 filter 进 
行 卷 积 , 卷 积 后 产生 6 个 特征 图 (Feature Map), 然 后 再 使 用 ReLUO 函 数 得 到 Cl 层 的 Feature 
Map， 在 卷 积 层 后 面 是 池 化 〈Pooling) 得 到 S2 层 。 卷 积 层 + 池 化 层 的 组 合 可 以 在 隐藏 层 出 
现 很 多 次 ， 例 如 图 19-11 中 出 现 了 两 次 ， 实 际 上 这 个 次 数 是 根据 模型 的 需要 而 来 的 。 用 户 
还 可 以 灵活 使 用 卷 积 层 + 卷 积 层 或 者 卷 积 层 + 卷 积 层 + 池 化 层 的 组 合 ， 这 些 在 构建 模型 的 时 
候 没 有 限制 ， 但 是 最 常见 的 CNN 都 是 若干 卷 积 层 + 池 化 层 的 组 合 ， 如 图 19-11 中 的 CNN 
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在 若干 卷 积 层 + 池 化 层 后 面 是 全 连接 层 (Full Connected Layer，FC)， 全 连接 层 其 实 就 
是 传统 的 神经 网 络 结构 ， 即 前 一 层 的 每 一 个 神经 元 都 与 后 一 层 的 所 有 神经 元 相连 ， 在 整个 
卷 积 神经 网 络 中 起 到 “分 类 器 ”的 作用 。 





19.3 Python 深度 学 习 库 一 一 Keras 


Keras 是 搭建 在 theano/tensorflow 基础 上 的 深度 学 习 框 架 ， 用 Python 视频 讲解 
语言 编写 ， 是 一 个 高 度 模块 化 的 神经 网 络 库 ， 支 持 GPU 和 CPU。 


19.3.1 Keras 的 安装 


@ 在 Windows 下 安装 Keras 


2 


在 安装 Keras 之 前 需要 安装 tensorflow、numpy、matplotlib、scipy 等 库 。 








pip install numpy 
pip install matplotlib 
pip install scipy 
pip install tensorflow 
pip install keras 


@ 使 用 Anaconda 安装 Keras 

在 “https://www.continuum.io/downloads/” 下 载 对 应 系统 版 本 的 Anaconda， 和 安装 普 
通 的 软件 一 样 , 全 部 选择 默认 即 可 , 注意 勾 选 将 Python3.6 添加 进 环境 变量 , 这 样 Anaconda 
就 安装 好 了 。 

打开 Anaconda 菜单 中 的 Anaconda Prompt， 输 入 : 


pip install --upgrade --ignore-installed tensorflow 
pip install keras 


© 测试 
安装 完成 后 ， 在 命令 行 下 输入 “python”， 进 入 Python 环境 后 输入 : 


import numpy 
import scipy 
import tensorflow as tf 
import keras 


若 没 有 错误 提示 ， 则 表示 安装 完成 。 
19.3.2 ”Keras 的 网 络 层 


Keras 的 层 主要 包括 常用 层 (Core)、 卷 积 层 (Convolutional)、 池 化 层 (Pooling)、 











TI 
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部 连接 层 、 递 归 层 (Recurrent)、 拘 入 层 (Embedding)、 高 级 激活 层 、 规 范 层 、 噪 声 层 、 
包装 层 ， 当 然 用 户 也 可 以 编写 自己 的 层 。 


对 于 层 的 操作 如 下 : 

layer.get weights() # 返 回 该 层 的 权重 (numpy array) 
layer.set weights (weights) # 将 权重 加 载 到 该 层 
config=layer.get config() # 保 存 该 层 的 配置 
layer=layer from config (config) ## 加 载 一 个 配置 到 该 层 


# 如 果 层 仅 有 一 个 计算 结 点 〈 即 该 层 不 是 共享 层 )， 则 可 以 通过 下 列 方法 获得 输入 张 量 、 输 出 张 量 、 
# 输 入 数据 的 形状 和 输出 数据 的 形状 
layer.input 

layer.output 

layer.input shape 

layer.output shape 

# 如 果 该 层 有 多 个 计算 结 点， 可 以 使 用 下 面 的 方法 
layer.get input at(node index) 
layer.get output at (node index) 
layer.get input shape at (node index) 
layer.get output shape at (node index) 


下 面 介绍 本 章 案例 中 所 使 用 的 网 络 层 。 

@ 一 维 卷 积 层 

ep 层 是 对 图 像 的 卷 积 。 该 层 对 二 维 输入 进行 滑动 窗 卷 积 ， 当 使 用 该 层 作为 第 1 
， 应 提供 input_shape 参数 。 例 如 input_shape=(128,128,3) 代 表 128x128 的 彩色 RGB 图 





和 (data format='channels last')。 


操作 如 下 : 

keras.layers.convolutional .Conv2D (filters, kernel size, strides=(1, 1), 
padding='valid', data format=None, dilation rate=(1, 1), activation=None, 
use bias=True, kernel initializer='glorot uniform'， 

bias initializer='zeros', kernel regularizer=None, bias regularizer=None, 
activity regularizer=None, kernel constraint=None, bias constraint=None) 


参数 如 下 。 

。 filters: 卷 积 核 的 数目 〈 即 输出 的 维度 )。 

。 kernel size: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 卷 积 核 的 宽度 和 长 度 。 如 为 单 
个 整数 ， 则 表示 在 各 个 空间 维度 的 相同 长 度 。 

strides: 单个 整数 或 由 两 个 整数 构成 的 lisytuple， 是 卷 积 的 步 长 。 如 果 为 单个 整数 ， 
则 表示 在 各 个 空间 维度 的 相同 步 长 。 任 何不 为 1 的 strides 与 任何 不 为 1 的 dilation_ 
rate 均 不 兼容 。 

padding: 补 0 策略 ， 为 "valid' 或 same'。'"valid' 代 表 只 进行 有 效 的 卷 积 ， 即 对 边界 数据 
不 处 理 。'same' 代 表 保 留 边界 处 的 卷 积 结果 , 通常 会 导致 输出 shape 与 输入 shape 相同 。 
activation: 激活 函数 ， 为 预定 义 的 激活 函数 名 (参考 激活 函数 ) 或 逐 元 素 
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(element-wise) 的 Theano 函数 。 如 果 不 指定 该 参数 ， 将 不 会 使 用 任何 激活 函数 ( 即 
使 用 线性 激活 函数 :a(x)=x)。 
dilation rate: 单个 整数 或 由 两 个 整数 构成 的 list/tuple， 指 定 dilated convolution 中 的 
膨胀 比例 。 任 何不 为 1 的 dilation_rate 与 任何 不 为 1 的 strides 均 不 兼容 。 

data_ format: 字符 串 ，'channels first' 或 '(channels last 之 一 ， 代 表 图 像 的 通道 维 的 位 
置 。 该 参数 是 Keras 1.x 中 的 image_dim ordering，'channels_ last 对 应 原本 的 "tp， 
'channels_first' 对 应 原本 的 "th'。 以 128x128 的 RGB 图 像 为 例 ，'channels_first 应 将 数 
据 组 织 为 (3,128.128)， 而 'channels_last 应 将 数据 组 织 为 (128.128.3)。 该 参数 的 默认 值 
是 ~/.keras/keras.json 中 设置 的 值 ， 若 从 未 设置 过 ， 则 为 'channels last'。 

use_bias: 布尔 值 ， 是 否 使 用 偏 置 项 。 

kernel initializer: 权 值 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初始 
化 权重 的 初始 化 器 。 

bias_initializer: 偏 置 向 量 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初 
始 化 偏 置 向 量 的 初始 化 器 。 

kermel regularizer: 施加 在 权重 上 的 正则 项 ， 为 Regularizer 对 象 。 

bias_regularizer: 施加 在 偏 置 向 量 上 的 正则 项 ， 为 Regularizer 对 象 。 
activity_regularizer: 施加 在 输出 上 的 正则 项 ， 为 Regularizer 对 象 。 
kernel_constraint: 施加 在 权重 上 的 约束 项 ， 为 Constraint 对 象 。 

bias_constraint: 施加 在 偏 置 上 的 约束 项 ， 为 Constraint 对 象 。 


@ Dense 层 (全 连接 层 ) 
操作 方法 如 下 : 


keras.layers.core.Dense (units,activation=None,use bias=True, kernel 
initializer='glorot uniform',bias initializer='zeros',kernel regularizer= 






































None,bias regularizer=None,activity regularizer=None, kernel constraint= 
None,bias_ constraint=None) 


参数 如 下 。 

units: 大 于 0 的 整数 ， 代 表 该 层 的 输出 维度 。 

use_bias: 布尔 值 ， 是 否 使 用 偏 置 项 。 

kemel_initializer: 权 值 初始 化 方法 ， 为 预定 义 初始 化 方法 名 的 字符 串 ， 或 用 于 初始 
化 权重 的 初始 化 器 。 

bias_initializer: 偏 置 向 量 初 始 化 方法 ， 为 预定 义 初 始 化 方法 名 的 字符 串 ， 或 用 于 初 
始 化 偏 置 向 量 的 初始 化 器 。 

regularizer: 正则 项 ，kernel 为 权重 的 ，bias 为 偏执 的 ，activity 为 输出 的 。 
constraint: 约束 项 ，kemel 为 权重 的 ，bias 为 偏执 的 。 

全 Activation 层 

操作 方法 如 下 : 

keras.1layers.core.Activation (activation) 

激活 层 对 一 个 层 的 输出 施加 激活 函数 。 

activation 是 将 要 使 用 的 激活 函数 ， 为 预定 义 激活 函数 名 或 一 个 Tensorflow/Theano 的 
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输入 shape 任意 ， 当 使 用 激活 层 作 为 第 1 层 时 要 指定 input_ shape。 
输出 shape 与 输入 shape 相同 。 

@ 最 大 池 化 层 MaxPooling2D 

操作 方法 如 下 : 


keras.layers.pooling.MaxPooling2D (pool size=(2,2),strides=None,padding= 














'valid', data format=None) 


参数 如 下 。 
。 pool size: 整数 或 长 为 2 的 整数 tuple， 代 表 在 两 个 方向 ( 竖 直 、 水 平 ) 上 的 下 采样 


因子 ， 例 如 取 (2,2) 将 使 图 片 在 两 个 维度 上 均 变 为 原 长 的 一 半 。 它 为 整数 ， 意 为 各 个 
维度 值 相同 且 为 该 数字 。 
strides: 整数 或 长 为 2 的 整数 tuple， 或 者 为 None， 步 长 值 。 


。 padding: 'valid' 或 者 'same'。 
data_format: 字符 串 ，'channels_first' 或 (channels last 之 一 ， 代 表 图 像 的 通道 维 的 位 


置 。 该 参数 是 Keras 1.x 中 的 image_dim ordering，'channels last" 对 应 原本 的 'tf， 





'channels_first' 对 应 原本 的 'th'。 
19.3.3 ”用 Keras 构建 神经 网 络 


用 Keras 构建 网 络 的 过 程 可 用 图 19-12 所 示 。 


和 序 仙 模 型 
数 式 横 开 ; 


stepl: 选择 模型 | 
/ 导 


/ \ 
/ 
/ AN 


| \ 1 
| ”一 sep2: 构 建 罗 络 层 
| 













~ 


每 层 都 可 以 包括 各 种 网 络 层 


\ a 

\ NH sm Bi : 

\ a 

提供 格式 化 数据 、 
Se 提供 格式 化 数据 -~~~ 下 


图 19-12 用 Keras 搭建 神经 网 络 
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下 面 以 一 个 简单 的 例子 演示 使 用 Keras 如 何 构 建 网 络 结构 并 进行 训练 及 预测 。 
首先 引入 库 ， 并 建立 一 个 顺序 模型 ，Sequential 就 是 一 个 空 的 网 络 结构 ， 方 法 如 下 : 


from keras.models import Sequential 





model=Sequential () 


在 Keras 里 面 可 以 构建 一 些 其 他 的 网 络 结构 ， 仅 需要 写 .add， 后 面 加 入 层 的 类 型 即 可 。 
下 例 中 引入 了 Dense〈 也 就 是 fr 层 ) 和 激活 函数 层 (RELU): 

from keras.layers import Dense, Activation 

# 再 分 别 add fc、relu、fc、softmax 层 

model.add (Dense (units=64, input dim=100) ) 

model .add (Activation ("relu")) 

model .add (Dense (units=10)) 

model .add (Activation ("softmax")) 


编译 模型 ， 损 失 函 数 loss 用 交叉 焙 ， 优 化 器 用 sgd， 评 估 用 accuracy: 


model.compile (loss='categorical crossentropy', optimizer='sgd', metrics= 




















['accuracy']) 
载 入 训练 数据 集 进行 训练 : 

model.fit (x train, y train, epochs=5, batch size=32) 
对 测试 集 进 行 如 下 操作 : 


evaluate loss and metrics = model.evaluate (x test, y test, batch size=128) 


19.4 程序 设计 的 思路 


@ 数据 集 描述 

在 本 实例 中 ， 训 练 样本 和 识别 测试 数据 都 是 28x28 像素 ， 如 图 19-13 
所 示 的 图 片 ， 它 在 计算 机 中 的 存储 是 一 个 二 维和 矩阵 ，0 代表 白色 ，1 代表 黑色 ， 小 数 代表 某 
程度 的 灰色 。 那 么 输入 层 就 应 该 是 28x28=786 个 神经 元 (忽略 它 的 二 维 结构 )， 其 中 每 个 
神经 元 的 输入 数据 就 是 该 像素 的 灰 度 值 。 整 个 数据 集 被 分 成 两 部 分 ， 即 60000 行 的 训练 数 
据 集 和 10000 行 的 测试 数据 集 ，60000 行 的 训练 数据 集 是 一 个 形状 为 [60000.784] 的 张 量 ， 
第 1 个 维度 数字 用 来 索引 图 片 ， 第 2 个 维度 数字 用 来 索引 每 张 图 片 中 的 像素 点 。 在 此 张 量 
中 的 每 一 个 元 素 都 表示 某 张 图 片 中 的 某 个 像素 的 强度 值 ， 值 的 取 值 范围 为 0 一 1。 

输出 结果 只 有 10 个 数字 〈 即 10 类 )， 输 出 层 是 10 个 神经 元 ， 每 个 神经 元 对 应 一 个 要 
识别 的 结果 。 

@ 网 络 结构 

网 络 层 级 结构 概述 : 5 层 神经 网 络 。 

输入 层 : 输入 数据 为 原始 训练 图 像 。 

第 一 卷 积 层 : 6 个 5x5 的 卷 积 核 ， 步 长 Stride 为 1。 在 这 一 层 中 ,输入 为 28x28 的 深度 
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为 1 的 图 片 数据 ， 输 出 为 24x24 的 深度 为 6 的 特征 图 。 











0000 00 0 0 0 0 0 0 0 0 0 
000000 0 0 0 0 0 0 0 0 0 
0 0 0 00 0 国 国 " 0 0 0 0 0o 
oooonoo 加 国 。 oo。 oo 
0 0 0 00 0 国 加 " 0 0 0 0 0 
ooooo 园 国 国 。。o 
二 00000000 "0 国 国 oo。 o% o% 0% "0 
3 00000000 00 国 国 0。 0。 0。0 0 
o00 0 00 0 0 加 加 oo 0% 0% 0 
oo000000 国 国 。 °。°。0。， 
"0 0 0 0 0 0 "5 国 图 Do 0 0 0 
00000 0 0 克 图 Yo 0 0 0 
0000o0o0500o00o 0 0 0 0 0 0 " 
o0 0 0 00 0 0 0 0 0 0 0 0 0 


图 19-13 输入 图 像 


第 一 池 化 层 ， 卷 积 核 size 为 2x2， 步 长 Stride 为 2 的 最 大 池 化 。 在 这 一 层 中 ， 输 入 为 
24x24 的 深度 为 6 的 特征 图 ， 输 出 为 12x12 的 深度 为 6 的 特征 图 。 
第 二 卷 积 层 : 12 个 5x5 的 卷 积 核 ， 步 长 Stride 为 1。 在 这 一 层 中 ， 输 入 为 12x12 的 深 


度 为 6 的 图 片 


数据 ， 输 出 为 8x8 的 深度 为 12 的 特征 图 。 


第 二 池 化 层 : 卷 积 核 size 为 2x2， 步 长 Stride 为 2 的 最 大 池 化 。 在 这 一 层 中 ， 输 入 为 


8x8 的 深度 为 


12 的 特征 图 ， 输 出 为 4x4 的 深度 为 12 的 特征 图 。 


输出 层 ， 输出 为 10 维 向 量 ， 激 活 函数 为 sigmoid。 


@ 代码 流程 简 述 

(1) 获取 训练 数据 和 测试 数据 。 

(2) 训练 网 络 的 超 参 数 的 定义 学 习 率 ， 每 次 迭代 中 训练 的 样本 数目 ， 和 迭代 次 数 )。 
(3) 构建 网 络 层级 结构 。 





(4) 编译 模型 。 
(5) 训练 模型 。 
(6) 网 络 模型 评估 。 


19.5 程序 设计 的 步骤 





19.5.1 


MNIST ( 


MNIST 数据 集 


Mixed National Institute of Standards and Technology database) 是 一 个 计算 机 


视觉 数据 集 , 它 包 含 70000 张 手写 数字 的 灰 度 图 片 , 其 中 每 一 张 图 片 包含 28x28 个 像素 点 。 
手写 体 数据 集 (MNIST) 文件 的 下 载 如 下 。 
训练 集 样本 : tlOk-images.idx3-ubyte (下 载 地 址 为 “http://Iluanpeng.0ss-cn-qingdao. 
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aliyuncs.com/csdn/python/%E6%89%8B%ES%86%99%EA4%BDY%I93W%E6%I9S5%BOW%E6%SD% 
AFE/tl0k-images.idx3-ubyte” )。 

训练 集 标签 :t10k-labels.idx1-ubyte( 下载 地 址 为 “http://Iluanpeng.0ss-cn-qingdao.aliyuncs. 
com/csdn/python/%E6%89%8B%ES%86%99%E4%BD%93%E6%95%BOW%WE6%S8DW%AE/tIOk- 
labels.idxl-ubyte”) 。 

测试 集 样 本 : train-images.idx3-ubyte (下 载 地 址 为 “http:/luanpeng.oss-cn-qingdao. 
aliyuncs.com/csdn/python/%E6%89%8B%ES5%86%99%E4%BDY%I93%E6%I95%BOWE6%SD% 
AFE/train-images.idx3-ubyte” )。 

测试 集 标签 : train-labels.idx1-ubyte( 下 载 地 址 为 “http://Iluanpeng.o0ss-cn-qingdao.aliyuncs. 
com/csdn/python/%E6%89%8B%ES%86%99%E4%BD%93%E6%95%BOW%E6%S8D%AE/train- 
labels.idxl-ubyte”)。 


19.5.2 ”手写体 识别 案例 实现 


@ 读 取 MNIST 数据 集 

编写 文件 MNISTpy， 用 于 获取 手写 图 像 数据 ， 每 张 图 像 是 28x28 像素 大 小 ， 根 据 需 
要 转换 成 长 度 为 784 的 行 向 量 。 

每 个 对 象 的 标签 为 0 一 9 的 数字 ，one-hot 编码 成 10 维 的 向 量 。 


#MNIST.py 文件 
import numpy as np 
# 数 据 加 载 器 基 类 ， 派 生出 图 片 加 载 器 和 标签 加 载 器 
class Loader (object) : 
# 初 始 化 加 载 器 ，path 为 数据 文件 路 径 ，count 为 文件 中 的 样本 个 数 
def init _(self, path, count): 
self .path=path 
self.count=count 
# 读 取 文 件 内 容 
def get file content (self): 
print (self.path) 
f=open (self.path, 'rb') 


content=f.read() # 读 取 字 节 流 
f.close() 
return content # 字 节 数 组 

# 图 像 数 据 加 载 器 


class ImageLoader (Loader): 
# 内 部 函数 ， 从 文件 字 节 数组 中 获取 第 index 个 图 像 数 据 ， 文 件 中 包含 所 有 样本 图 片 的 数据 
def get picture(self, content, index): 
start=index*28*28+16 


# 文 件 头 16 字 节 ,后面 每 28x28 个 字 节 为 一 个 图 片 数据 
picture=[] 


for i in range(28): 
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picture.append ([]) # 图 片 添加 一 行 像素 
for j in range(28) : 
bytel = content [start+i*28+]] 
picture[il] .append (bytel) # 在 Python3 中 本 来 就 是 int 
#picture[i] .append (self.to int (bytel)) # 添 加 一 行 的 每 一 个 像素 
return picture 
# 图 片 为 [[x, x,z.…] [zx, Xx, zx...] [x, x,x..-.] [x,x,x...]] 的 列表 
# 将 图 像 数据 转化 成 长 度 为 784 的 行 向 量 形式 
def get one sample (self, picture): 
sample=[] 
for i in range(28): 
for j in range (28) : 
sample.append (picture[i] [j]) 
return sample 


# 加 载 数据 文件 ， 获 得 全 部 样本 的 输入 向 量 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向 量 ，to2 


# 表 示 是 否 转化 为 0, 1 箱 阵 
def load(self,onerow=False) : 
content=self.get file content() # 获 取 文 件 字 节 数 组 
data set=[] 
for index in range(self.count) : # 人 遍历 每 一 个 样本 


onepic=self.get picture(content, index) 
## 从 样本 数据 集中 获取 第 index 个 样本 的 图 片 数 据 ， 返 回 的 是 二 维 数组 
if onerow: onepic=self.get one sample (onepic) 
# 将 图 像 转化 为 一 维 向 量 形式 
data set.append (onepic) 
return data set 
# 标 签 数据 加 载 器 
class LabelLoader (Loader): 
# 加 载 数 据 文件 ， 获 得 全 部 样本 的 标签 向 量 
def load(self) : 


content=self.get file content () # 获 取 文件 字 节 数组 

labels=[] 

for index in range (self.count) : # 饥 历 每 一 个 样本 
onelabel=content [index + 8] # 文 件 头 有 8 个 字 节 
onelabelvec=self.norm(onelabel) #one-hot 编码 


labels.append (onelabelvec) 
return labels 
# 内 部 函数 ，one-hot 编码 ， 用 于 将 一 个 值 转换 为 10 维 标签 向 量 
def norm(self, label): 
label vec=[] 
#label value=self.to int(label) 
label value=label # 在 Python3 中 直接 就 是 int 


for i in range(10) : 


379 | 





| 项 目 案例 开发 
从 入 门 到 实战 一 一 爬虫 、 游 戏 和 机 器 学 习 


if i==label value: 
label vec.append(1) 
else: 
label vec.append(0) 
return label vec 
# 获 得 训练 数据 集 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向 量 
def get training data set (num,onerow=False): 
image loader=ImageLoader ('train-images.idx3-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
label loader=LabelLoader('train-labels.idxl-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
return image loader.load(onerow), label loader.1o0ad() 
# 获 得 测试 数据 集 ，onerow 表示 是 否 将 每 张 图 片 转化 为 行 向 量 
def get test data set (num,onerow=False) : 
image loader=ImageLoader('t1l0k-images.idx3-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
label loader=LabelLoader('t1l0k-labels.idxl-ubyte', num) 
# 参 数 为 文件 路 径 和 加 载 的 样本 数量 
return image loader.1oad (onerow), label loader.load () 
# 将 一 个 长 度 为 784 的 行 向 量 打印 成 图 形 的 样式 
def printimg (onepic) : 
onepic=onepic.reshape (28, 28) 
for i in range(28): 
for j in range(28): 
if onepic[i,j]==0: print(' ',end="'') 
else: print('* ',end="'') 


printi(®) 
@ 训练 及 测试 数据 集 


import numpy as np 

np.random.seed(1337)  # 可 重 现 性 

from keras.models import Sequential 

from keras.layers import Dense, Dropout, Activation, Flatten 
from keras.layers import Conv2D, MaxPooling2D,AveragePooling2D 
import MNIST 


# 全 局 变量 

batch size=128 # 批 处 理 样本 数量 

nb classes=10 # 分 类 数目 
epochs=600 # 和 进 代 次 数 

img rows, img cols=28, 28 # 输 入 图 片 样本 的 宽 、 高 
nb filters=32 # 卷 积 核 的 个 数 

pool size=(2, 2) # 池 化 层 的 大 小 

kernel size=(5, 5) # 卷 积 核 的 大 小 

input shape=(img rows, img cols,1) # 输 入 图 片 的 维度 
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X train，Y train=MNIST.get training data set(6000, False) 
# 加 载 训练 样本 数据 集 和 one-hot 编码 后 的 样本 标签 数据 集 ， 最 大 为 60000 
X test，Y test=MNIST.get test data set(1000, False) 
# 加 载 测试 特征 数据 集 和 one-hot 编码 后 的 测试 标签 数据 集 ， 最 大 为 10000 
X train=np.array (X train) .astype (boo1) .astype (float)/255 
# 数 据 归 一 化 
X train=X train[:,:,:,np.newaxis] 
# 添 加 一 个 维度 ， 代 表 图 片 通道 ， 这 样 数据 集 共 4 个 维度 ， 即 样本 个 数 、 宽 度 、 高 度 、 通 道 数 
Y train=np.array(Y train) 
X_test=np.array(X_test) .astype (boo1) .astype (float)/255 # 数 据 归 一 化 
X test=X test[:,:,:,np.newaxis] 
# 添 加 一 个 维度 ， 代 表 图 片 通道 ， 这 样 数据 集 共 4 个 维度 ， 即 样本 个 数 、 宽 度 、 高 度 、 通 道 数 
Y test=np.array(Y test) 
print (' 样 本 数据 集 的 维度 : '，X train.shape,Y train.shape) 
print (' 测 试 数据 集 的 维度 : '，X test.shape,Y test.shape) 
# 构 建 模型 
model=Sequential () 
model.add (Conv2D (6, kernel size,input shape=input shape, strides=1)) 


# 卷 积 层 1 
model .add (AveragePooling2D (pool size=pool size,strides=2)) # 池 化 层 
model.add (Conv2D (12, kernel size,strides=1)) # 卷 积 层 2 
model.add (AveragePooling2D (pool size=pool size,strides=2)) # 池 化 层 
model.add (Flatten ()) # 拉 成 一 维 数据 
model.add (Dense (nb _classes)) # 全 连接 层 2 
model.add (Activation('sigmoid') ) #5sigmoid 评分 


# 编 译 模型 

model .compile (loss='categorical crossentropy',optimizer='adadelta', 
metrics=['accuracy']) 

# 训 练 模型 

model.fit (x train, Y train, batch size=batch size, epochs=epochs, 
verbose=]1, validation data=(X test, Y test)) 

# 评 估 模 型 

score=model .evaluate(X test, Y test, verbose=0) 

print('Test score:', score[0]) 

print('Test accuracy:', score[1]) 

# 保 存 模型 

model.save('cnn model.h5')  #HDF5 文件 pip install h5py 


输出 结果 如 下 : 


Test score: 0.18881544216349722 
Test accuracy: 0.959 


1 于 训练 时 间 太 久 ， 读 者 可 自行 减少 训练 集 及 测试 集 的 数量 ， 或 者 迭代 次 数 ， 观 察 训 
练 结果 。 
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19.5.3 ”预测 自己 手写 图 像 


@ 制作 自己 的 手写 图 像 
使 用 画图 工具 或 Photoshop 制作 一 个 28x28 像素 的 黑 底 白字 的 图 像 文件 ， 如 图 19-14 
所 示 。 
































图 19-14 自己 的 手写 图 像 


@ 编写 代码 
新 建文 件 my_predict.py， 编 写 代码 如 下 : 


from keras.models import load model 
import numpy as np 

import cv2 

model=load model ('cnn model.h5') 
image=cv2.imread('4.png', 0) 
img=cv2.imread('4.png', 0) 
img=np.reshape (img, (1,28,28,1)) .astype (bool) .astype ("float32") /255 
my proba=model .predict proba (img) 

my predict=model .predict classes (img) 
print (' 识 别 为 :') 

print (my proba) 

print (my predict) 

cv2.imshow ("Imagel", image) 

cv2 .waitKey (0) 
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20.1 功能 介绍 


“ 词 云 ” 就 是 对 网 络 文本 中 出 现 频率 较 高 的 “关键 词 ” 予以 视觉 上 的 突 
出 ， 形 成 “关键 词 云层 ”或 “关键 词 泻 染 ” 从 而 过 滤 掉 大 量 的 文本 信息 ， 
使 浏览 网 页 者 只 要 一 眼 扫 过 文本 就 可 以 领略 文本 的 主旨 。 

豆 办 电影 提供 了 最 新 的 电影 介绍 及 评论 ， 包 括 上 映 影片 的 影讯 查询 及 购 票 服务 ， 观 众 
可 以 记录 想 看 、 在 看 和 看 过 的 电影 /电视 剧 ， 以 及 打分 、 写 影评 。 豆 瓣 电 影 会 根据 观众 的 口 
味 推荐 好 电影 。 本 程序 使 用 Python 怜 虫 技术 获取 豆瓣 电影 (https:/movie.douban.com/) 中 
最 新 电影 的 影评 ， 经 过 数据 清理 和 词 频 统计 后 对 电影 《 黑 豹 》 的 影评 信息 进行 词 云 展示 ， 


效果 如 图 20-1 所 示 。 














图 20-1 《 黑 豹 》 影 评 信息 的 词 云 显示 结果 





| pe 项 目 案例 开发 
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20.2 程序 设计 的 思路 


本 程序 主要 分 为 3 个 过 程 

@ 抓 取 网 页 数据 

使 用 Python 怜 虫 技术 获取 豆瓣 电影 中 最 新 上 映 电 影 的 网 页 (如 图 20-2 所 示 )， 其 网 址 
如 下 : 


























https://movie.douban.com/cinema/nowplaying/zhengzhou/ 


电影 票 - 郑州 tml 


正在 上 映 





唐人 街 探 案 2 小 萝 和 的 猴 神 大 
友 女 妇 坟 去 7 1 妈妈 妇女 8 6 


图 20-2 最 新 上 映 电影 的 网 页 


通过 其 HTML 解析 出 每 部 电影 的 ID 号 和 电影 名 , 获取 某 ID 号 就 可 以 得 到 该 部 电影 的 
影评 网 址 ， 形 式 如 下 : 

https://movie.douban.com/subject/26861685/comments 
其 中 ，26861685 就 是 电影 《红海 行动 》 的 ID 号 。 这 样 仅仅 获取 了 20 个 影评 ， 可 以 指定 开 
始 号 start 来 获取 更 多 影评 ， 例 如 : 

https://movie.douban.com/subject/26861685/comments?start=40&limit=20 

这 意味 着 获取 从 第 40 条 开始 的 20 个 影评 。 

清理 数据 

常 将 某 部 影评 信息 存 入 eachCommentList 列表 中 。 为 便于 数据 清理 和 词 频 统计 ， 把 

eachCommentList 列表 形成 字符 串 comments， 将 comments 字符 串 中 的 “也 ”“ 太 ”“ 的 ” 
等 虚词 〈 停 用 词 ) 清理 掉 后 进行 词 频 统计 。 

图 用 词 云 进行 展示 

最 后 使 用 词 云 包 对 影评 信息 进行 词 云 展示 。 
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20.3 ”关键 技术 


be 





视频 讲解 


20.3.1 安装 WordCloud 


WordCloud 使 用 最 常规 的 pip install wordcloud 命令 安装 。 

如 果 安 装 失 败 ， 可 以 使 用 Windows 二 进 制 安 装 包 (WHIL 文件 ) 直接 安装 ， 步 又 如 下 ; 

首先 转 到 “http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud” 页 面 ， 下 载 需 要 的 对 
应 版 本 的 WordCloud 的 WHL 文件 。 如 果 用 户 使 用 的 是 64bit 的 Python3.5， 请 下 载 图 20-3 
中 框 住 的 文件 。 























Wordcloud, a little word cloud generator. 
wordcloud-1. 3. 1-cp27-cp27m-win32. whl 
wordcloud-1. 3. 1-cp27-cp27m-win_amd64. whl 
wordcloud-1. 3. 1-cp34-cp34m-win32. whl 
wordcloud-1. 3. 1-cp3d-cp3dm-win_amd64. whl 
wordcloud-1. 3. 1-cp35-cp35m-win32. whl 


wordcloud 




















wordcloud. 
wordcloud-1. 3, 1-cp36-cp36m-win_amd64. whl 











图 20-3 ”下载 文件 


然后 在 cmd 命令 行 中 进入 到 刚刚 下 载 的 文件 的 路 径 ， 使 用 pip install 
wordcloud-1.3.1-cp35-cp35m-win_amd64.whl 命令 开始 安装 ， 大 约 一 分 钟 就 可 以 安装 完成 。 


20.3.2 ”使 用 WordCloud 


@@ WordCloud 的 基本 用 法 


class wordcloud.WordCloud (font path=None, width=400, height=200, margin=2, 
ranks only=None, prefer horizontal=0.9, mask=None, scale=1, 

color func=None, max words=200, min font size=4, stopwords=None, 

random state=None, background color='black', max font size=None, 

font step=1, mode='RGB', relative scaling=0.5, regexp=None, 
collocations=True, colormap=None, normalize plurals=True) 


这 是 WordCloud 的 所 有 参数 ， 下 面具 体 介 绍 一 下 各 参数 。 

。 font_path: 需要 展现 什么 字体 就 把 该 字体 路 径 + 扩 展 名 写 上 ， 例 如 font_path = ' 黑 
体 -ttf '。 

。 width: 输出 的 画布 宽度 ， 默 认为 400 像素 。 
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。 height: 输出 的 画布 高 度 ， 默 认为 200 像素 。 

。 prefer horizontal: 词语 水 平方 向 排版 出 现 的 频率 ， 默 认为 0.9〈 所 以 词语 垂直 方向 
排版 出 现 的 频率 为 0.1)。 

。 mask: 如 果 该 参数 为 室 ， 则 使 用 二 维 遮 罩 绘制 词 云 ， 如 果 该 参数 非 空 ， 设 置 的 宽 / 

高 值 将 被 忽略 ， 遮 界 形 状 将 被 mask 取代 。 除 了 全 和 白 〈 考 FFFFF) 部 分 不 会 绘制 以 

外 ， 其 余部 分 会 用 于 绘制 词 云 。 例 如 bg_pic = imread(' 读 取 一 张 图 片 .png)， 背 景 图 

片 的 画布 一 定 要 设置 为 白色 〈 考 FFFFF)， 然 后 显示 的 形状 为 不 是 白色 的 其 他 颜色 。 

用 户 可 以 用 PS 工具 将 自己 要 显示 的 形状 复制 到 一 个 纯 白色 的 画布 上 ， 然 后 保存 。 

Scale: 按照 比例 放大 画布 ， 例 如 设置 为 1.5， 则 长 和 宽 都 是 原来 画布 的 1.5 倍 。 

。 min font size: 显示 的 最 小 的 字体 大 小 。 

font_step: 字体 步 长 ， 如 果 步 长 大 于 1， 会 加 快运 算 ， 但 是 可 能 导致 结果 出 现 较 大 

的 误差 。 

。 max_words: 要 显示 的 词 的 最 大 个 数 。 

。 stopwords: 设置 需要 屏蔽 的 词 ， 如 果 为 空 ， 则 使 用 内 置 的 STOPWORDS。 

。 background color: 背景 颜色 ， 例 如 background_color='white'， 背 景 颜色 为 白色 ， 默 

认 颜 色 为 黑色 。 

max_font_size: 显示 的 最 大 的 字体 大 小 。 

mode: 当 该 参数 为 “RGBA ”并且 background_color 不 为 空 时 背景 透明 。 

relative_scaling: 词 频 和 字体 大 小 的 关联 性 。 

color func: 生成 新 颜色 的 函数 ， 如 果 为 空 ， 则 使 用 self.color_func。 

regexp: 使 用 正则 表达 式 分 隔 输 入 的 文本 。 

collocations: 是 否 包括 两 个 词 的 搭配 。 

colormap: 给 每 个 单词 随机 分 配 颜色 ， 若 指定 color func， 则 忽略 该 方法 。 

WordCloud 提供 的 方法 如 下 。 

。 fit_words(frequencies): 根据 词 频 生 成 词 云 。 

generate(texb: 根据 文本 生成 词 云 。 

generate_ from frequencies(frequencies[,…]): 根据 词 频 生 成 词 云 。 

generate_ from_text(text): 根据 文本 生成 词 云 。 

process_text(text): 将 长 文本 分 词 并 去 除 屏蔽 词 ( 此 处 指 英语 ， 中 文 分 词 还 需要 自己 

用 其 他 库 先 行 实现 ， 使 用 上 面 的 fit_ words(frequencies))。 

。 recolor([random_state,color_func,colormap]): 对 现 有 输出 重新 着 色 ， 重 新 着 色 会 比重 
新 生成 整个 词 云 快 很 多 。 

。 to_array(): 转化 为 numpy array。 

。 to_file(filename): 输出 到 文件 。 

加 WordCloud 的 应 用 举例 


# 导 入 wordcloud 模块 和 matplot1lib 模块 
from wordcloud import WordCloud, ImageColorGenerator,STOPWORDS 














import matplotlib.pyplot as plt 


from scipy.misc import imread 
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text=open ('test.txt','r') -read() # 读 取 一 个 TXT 文件 
bg pic=imread('alice.png') # 读 入 背景 图 片 
"设置 词 云 样式 

wc=WordCloud( 


background color='white', 
#background color 参数 用 于 设置 背景 颜色 ， 默 认 颜色 为 黑色 
mask=bg pic, 
# 有 中 文 这 句 代 码 必须 添加 ， 否 则 会 只 出 现 方 框 而 不 出 现 汉字 
font path='simhei .ttf', # 通 过 font path 参数 来 设置 字体 集 
max words=2000, 
max font size=150, 
random state=30, scale=1.5) 


wc.generate from text (text) # 根 据 文本 生成 词 云 
image colors=ImageColorGenerator (bg pic) 

plt.imshow (wc) 埋 显示 词 云图 片 
pltsaxist off") 

plt.show() 

print('display success!') 

wc.to file('test2.jpg') # 保 存 图 片 





只 有 在 设置 mask 的 情况 下 才 会 得 到 一 个 拥有 图 片 形状 的 词 云 。 本 程序 使 用 的 模板 图 











是 alice.png〔( 如 图 20-4 所 示 )， 生 成 的 词 云 形状 如 图 20-5 所 示 。 





图 20-4 ”模板 图 图 20-5 生成 的 词 云图 


人 @ 设置 停 用 词 
用 户 也 可 以 设置 停 用 词 “ 太 ”“ 的 ”等 虚词 )， 使 得 词 云 中 不 显示 该 虚词 ， 例 如 : 


from os import path 
from PIL import Image 
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import numpy as np 

import matplotlib.pyplot as plt 

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator 
# 读 取 整 个 文章 

text=open ('test.txt','r') -read() # 读 取 一 个 TXT 文件 

# 读 取 遮 单 /彩色 图 像 

alice coloring=np.array (Image.open (path.join(d, "alice color.png"))) 
# 设 置 停 用 词 

stopwords=set (STOPWORDS) 

stopwords .add ("的 ") # 人 工 添加 停 用 词 

stopwords.add ("7") # 人 工 添加 停 用 词 

# 可 以 通过 mask 参数 来 设置 词 云 形状 

wc=WordCloud (background color="white", max words=2000, mask=alice 
coloring, stopwords=stopwords, max font size=40, random state=42) 
# 生 成 词 云 

wc.generate (text) 

# 根 据 图 片 生成 颜色 

image colors=ImageColorGenerator (alice coloring) 

plt.imshow (wc, interpolation="bilinear") 

pltsaxis("ofFf") 

plt.show() 


人 @ WordCloud 使 用 词 频 


import jieba.analyse 
from PIL import Image, ImageSequence 
import numpy as np 
import matplotlib.pyplot as plt 
from wordcloud import WordCloud, ImageColorGenerator 
lyric="" 
f=open('./test.txt','r') 
Eor 3 in Es 
lyric+=f.read() 
# 用 jieba 对 文章 做 分 词 ， 提 取出 词 频 高 的 前 50 个 词 
result=jieba.analyse.textrank (lyric, topK=50,withWeight=True) 
keywords=dict () 
for i in result: 
keywords [i[0]]=i[1] 
print (keywords) 


输出 如 下 : 


{'” 听见 ':0.26819943990969086,， 风 雨 ':0.4369472045572426,， 不 能 ': 


0.41455711258992367,' 生 命 ':0.5934235845918548, ' 理 想 ' :0.26510877668765925, ' 星 河 ' : 
0.23975886019089002, ' 青 春 ' :0.24010255181105905, ' 希望 ' :0.494835681401572, ' 痛 算 ': 
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0.27939232288036236, ' 梦想 ' :0.6607157592927637,' 大 家 ' :0.2630206522238169, ' 日 落 ': 
0.24124829031114808,， 相信 ':1.0,' 随 风 ':0.24679509210701486,， 热 血 ': 
0.3747213789071734, ' 怒 放 ' :0.4236733731776506, ' 忘掉 ' :0.37456984152879724, ' 卷 起 ': 
0.28349442481975,' 兄弟 ':0.41239452275709515, ' 超越 ':0.39647241012049056, ' 英雄 ' : 
0.313110375266555513, ' 像 是 ' :0.30426828861337796, ' 跌 倒 ' :0.3625975500392993,' 想 要 ' : 
0.5829550209468557, ' 命运 ':0.7201128992940313, ' 变化 ':0.2686953866879604,' 天 空 ': 
0.3146976061015469, ' 父 亲 ' :0.24636152229739733, ' 世 界 ':0.3565812143701714, ' 没 有 ': 
0.5977870162380065,' 人生 ':0.3775236250279759,"' 生活 ' :0.2663673685783774,"' 改变 二 
0.8023053505916324,' 穿 行 ' :0.30336139077497054, ' 海 洋 ' :0.28687650921373503，' 追 逐 ' : 
0.28164694577079186, ' 拥 有 ' :0.5511676957186838, ' 太 阳 ' :0.31281001159455113, ' 知 道 ' : 
0.28305393123835487, ' 拍 拍 ' :0.2877289851675474,' 摇 摆 ' :0.4813790823694424, ' 力 量 ': 
0.5692829648461694, ' 翅 膀 ' :0.36632797341678375,' 朋 友 ' :0.2528034375864833，' 挣脱 ' : 
0.39383738344839236, ' 奔跑 ':0.4640807450464461, ' 方 向 ' :0.4093246167577443, ' 就 算 ': 
0.9832790417761437, ' 水 手 ' :0.3471435439240663, ' 忘 记 ' :0.23862724809926258} 

image=Image.open('./tim.png') 

graph=np.array (image) 

wc=WordCloud (font path='./fonts/simhei.ttf',background color='White', 

max words=50,mask=graph) 

wc.generate from frequencies (keywords) # 词 频 生成 词 云 

image color=ImageColorGenerator (graph) 

plt.imshow (wc) 

plt.imshow (wc.recolor (color func=image color)) 

DULL- a%Ls ("OFFER 

plt.show() 

wc.to file('dream.png') 


20.4 程序 设计 的 步骤 人 


@ 抓 取 网 页 数据 视频 讲解 
首先 要 对 网 页 进行 访问 ， 在 Python 中 使 用 的 是 urllib 库 ， 代 码 如 下 : 


from urllib import request 





resp=request .urlopen('https://movie.douban.com/nowplaying/hangzhou/') 
html data=resp.read() .decode ('utf-8') 


其 中 ,“https://movie.douban.com/cinema/nowplaying/zhengzhou/” 是 豆 因 电影 最 新 上 映 的 电 
影 页 面 ， 用户 可 以 在 浏览 器 中 输入 该 网 址 进行 查看 ，html_data 是 字符 串 类 型 的 变量 ,里 面 
存放 了 网 页 的 HTML 代码 。 输 入 print(html data) 可 以 查看 最 新 上 映 影片 的 影讯 信息 ， 如 
图 20-6 所 示 。 

然后 对 得 到 的 HTML 代码 进行 解析 ， 提 取出 自己 需要 的 数据 。 在 Python 中 使 用 
BeautifulSoup 库 ( 如果 没 有 则 使 用 pip install BeautifulSoup 进行 安装 ) 进行 HTML 代码 的 
解析 。 
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<div id= "nowplaying "> 
《div class= mod-hd > 
<h2> 正 在 上 映 <Ah2> 
<zdiv> 
《div class="mod-bd’ > 
<ul class= "lists” > 
《1i 

II 中 “6390325” 
class=" list-item” 
datartitle=“ 黑 豹 " 
data-score="6.8" 
data-star=" 35" 
data-release="2018" 
data-duration="135 分 钟 (中 国 大 陆 )” 
data-region=" 国 
dt 出 rector=" 瑞 恩 * 库 格 勒 " 
dataractors=" 查 德 维 克 博 斯 曼 / 露 皮 塔 * 尼 永 奥 / 迈克 尔 * B: 乔丹 “ 
data-category=" nowplaying” 
data-enough=" True” 
data-showed=" True” 
data-votecoumt="64156" 
data-subject="6390825” 


图 20-6 最 新 上 映 影片 的 影讯 信息 














BeautifulSoup 使 用 的 格式 如 下 : 
BeautifulSoup (html, "htm]l .parser") 


第 1 个 参数 为 需要 提取 数据 的 HIML， 第 2 个 参数 是 指定 解析 器 ， 然 后 使 用 find_all0) 
读 取 HTML 中 的 内 容 。 

但 是 HTML 中 有 那么 多 的 标签 ,该 读 取 哪 些 呢 ? 其 实 , 最 简单 的 办 法 是 打开 怜 取 网 页 
的 HTML 代码 ， 然 后 查看 需要 的 数据 在 哪个 HTML 标签 里 面 ， 如 图 20-6 所 示 。 

由 图 20-6 可 以 看 出 , 从 <div id='nowplaying> 标 签 开 始 是 想 要 的 数据 , 里 面 有 电影 的 名 
称 、 评 分 、 主 演 等 信息 ， 所 以 相应 的 代码 编写 如 下 : 

from bs4 import BeautifulSoup as bs 


soup=bs (html data, 'html.parser') 
nowplaying movie=soup.find alll('div', id='nowplaying') 




















nowplaying movie list=nowplaying movie[0] .find all('li', class = 

'list-item') 
其 中 , nowplaying_movie list 是 所 有 电影 信息 的 一 个 列表 , 可 以 用 print(nowplaying_movie_ 
list[1]) 查 看 第 2 部 影片 《红海 行动 》 的 内 容 ， 如 图 20-7 所 示 。 

从 该 图 中 可 以 看 到 在 data-subject 属性 里 面 放 了 电影 的 ID 号 ,而 在 img 标签 的 alt 属性 
里 面 放 了 电影 的 名 字 ， 因 此 通过 这 两 个 属性 来 得 到 电影 的 ID 和 名 称 〈 在 打开 电影 短评 的 
网 页 时 需要 用 到 电影 的 ID， 所 以 需要 对 它 进行 解析 )， 编 写 代码 如 下 : 




















nowplaying list=[] 
for item in nowplaying movie list: 


nowplaying dict={} # 以 字典 形式 存储 每 部 电影 的 ID 和 名 称 
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nowplaying dict['id']=item['dqata-subject'] 

for tag img item in item.find all("img") : 
nowplaying dict['name']=tag img item['"alt'"] 
nowplaying list.append (nowplaying dict) 


i 
id 中 "26861685” 
class="list-iten” 





datarelsase="2018" 
data-duration="138 分 钟 ” 
data-regiom=" 中 国 大 陆 香港 

dat a 出 rector=" 林 超 贤 * 
data-actors=" 张 译 / 黄 景 疹 / 海 青 ” 
data-category="nowplaying” 

dat a-enough=" True” 

dat a-shoved=" True” 

dat a-votecount="312987” 

data- subject="26861685" 





《ul class=""> 
《1i class="poster"> 
“a href="https://novie, douban. con/subject/26361685/ ?Fromplaying_poster” class-ticket-btn target=" blank data-psource="poster"》 
Cing src=“https://ine3 doubanio. cn/view/ photo/s_ratio poster/public/n2514119443, webn”alt=" 记 海 行动 ”rel=“nofollow” class="" /> 
/a 
YD 
Cli class="stitle"> 
Ca href="https://novie. douban. com/subject/26861685/ fron=playine_poster” 
class="ticket-btn” 





dat -psource="title”> 
和 


/a 
A 


图 20-7 《红海 行动 》 电 影 信息 的 HTML 标签 





在 列表 nowplaying_list 中 存放 了 最 新 电影 的 ID 和 名 称 , 可 以 使 用 print(nowplaying_list) 
进行 查看 ， 结 果 如 下 : 


[{'id': '6390825'，'name': ' 黑 鹏 '}，{'id': '26861685'，'name' : ' 红 海 行动 ' } ， 

{'id': '26698897'，'name': ' 唐 人 街 探 案 2'},，{'id': "26393561'!， "name': ' 

小 葛 莉 的 猴 神 大 叔 '}，1{'id': '26649604'，'name' : ' 比 得 兔 '}，{'id': '26603666'， 

'name' : "妈妈 咪 网 '}，{'id': '30152451'，'name': ' 厉 害 了 ， 我 的 国 '}，{'id': 

'26972275'，'name' : ' 恋 爱 回旋 '}，{'id': '26575103'，'name':' 捉 妖 记 2')， 

{'id': '27176717'，"name"':' 能 出没- 变形 记 '}，1{"'id’: '26611804'，'name': 

' 三 块 广告 牌 '}，{'iqd': '25829175'，'"'name' :' 西 游记 女儿 国 '},，{'id': '27085923'， 

"name' : ' 灵 魂 当 铺 之 时 间 典 当 '}，{'id' : '27114417'，'name' : ' 祖 宗 十 九 代 '}， 

to 25899334 namer: 包办 iy dn "3036465. ,namey: 

' 爱 在 记忆 消逝 前 ' }，{'id' : '27180882'，'name' : ' 疯 狂 的 公牛 '}, {'id': '25856453'， 

'name': ' 半 蜜 2'}，{'id': '26836837'，'name': ' 宇 宙 有 爱 浪漫 同 游 ' }] 

可 以 看 到 是 和 豆 办 网 址 上 面 匹 配 的 ， 这 样 就 得 到 了 最 新 电影 的 信息 。 接 下 来 对 最 新 电 
影 短评 进行 分 析 。 例 如 《红海 行动 》 的 短评 网 址 为 “https://movie.douban.com/subject/ 
26861685/comments?start=0&limit=20”， 其 中 26861685 就 是 《红海 行动 》 电 影 的 ID, start=0 
表示 第 0 条 评论 。 

查看 上 面 的 短评 页 面 的 HIML 代码 ， 可 以 发 现 关 于 《红海 行动 》 评 论 的 数据 在 div 标 
签 的 comment 属性 下 面 ， 如 图 20-8 所 示 。 
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从 入 门 到 实战 一 一 看 虫 、 游 戏 和 机 器 学 习 





star40 rating”title=“ 推 荐 ">(/span> 
ent-tine ” title=r2018-02-13 15:35:16"> 


2 
lass=" 档 最 好 ! 最 好 不 是 战 狼 而 是 战争 ， 有 点 类 似 黑 启 坐车 ， 主 旋律 色彩 下 ， 真 实 又 残酷 的 战争 党 染 。 故事 性 不 经 ， Me 从 头 打 到 尾 ， 林 超 吕 场面 凋 度 极 


》 春节 
佳 ， a 、 A 军械 武器 展示 效果 不 模 。 尺 度 超大 ， 福 锯 妨 式 血肉 带 飞 ， 这 给 人 特写 ! 敌人 如 表 尸 一 般 打 不 完 ， 双 方 的 狙击 手 


di 


图 20-8 《红海 行动 》 短 评 信息 的 HIML 标签 


因此 对 该 标签 进行 解析 ， 代 码 如 下 : 





requrl='https://movie.douban.com/subject/' + nowplaying list[0]['id'] + 


'/comments' +'?' +'start=0' + '&limit=20"' 

resp=request .urlopen (requrl) 

html data=resp.read() .decode ('utf-8') 

soup=bs (html data, 'htm]l .parser') 
comment div lits=soup.find alll('div', class ='comment') 


此 时 在 comment_div_lits 列表 中 存放 的 就 是 class ='comment' 的 所 有 div 标签 里 面 的 HIML 
代码 了 。 在 图 20-8 中 还 可 以 发 现 <div class_ ='comment> 标 签 里 面 的 p 标签 下 面 存 放 了 网 友 
对 电影 的 评论 ， 因 此 对 comment_div_lits 代码 中 的 HTML 代码 继续 进行 解析 ， 代 码 如 下 : 




















eachCommentList=[]; 
for item in comment div lits: 
if item.find all('p') [0] .string is not None: 
eachCommentList.append (item.find all('p') [0] .string) 














使 用 print(eachCommentList) 查 看 eachCommentList 列表 中 的 内 容 ， 可 以 看 到 里 


了 大 家 想 要 的 影评 。 

至 此 已 经 爬 取 了 豆瓣 电影 最 近 播 放电 影 的 评论 数据 ， 接 下 来 就 要 对 数据 进行 清 
云 显示 了 。 

@ 数据 清洗 





j 存 放 














洗 和 词 


数据 清洗 是 消去 与 数据 分 析 无 关 的 信息 ， 这 里 为 了 方便 进行 数据 清洗 ， 将 列表 中 的 数 


据 放 在 一 个 字符 串 中 ， 代 码 如 下 : 


comments="" 





for k in range(len(eachCommentList)): 
comments=comments + (str (eachCommentList[k])) .strip() 


使 用 print(comments) 进 行 查看 ， 可 以 看 到 所 有 的 评论 已 经 变 成 一 个 字符 串 ， 但 





中 还 有 很 多 标点 符号 等 。 这 些 符 号 对 词 频 统计 根本 没 用 ， 因 此 要 将 它们 清除 ， 所 用 
是 使 用 正则 表达 式 ，Python 中 的 正则 表达 式 是 通过 re 模块 实现 的 。 其 代码 如 下 : 























| 392 


是 评论 
的 方法 


第 20 章 词 云 实战 一 疏 取 豆 瘀 影评 生成 词 云 2 0 





import re 
pattern=re.compile(r'[\u4e00-\u9fa5]+"') 
filterdata=re.findall (pattern, comments) 


cleaned comments="''.join(filterdata) 


继续 使 用 print (cleaned_comments) 语句 进行 查看 ， 可 以 看 到 此 时 评论 数据 中 已 经 没 
有 那些 标点 符号 了 ， 数 据 被 清 “ 干 净 ” 了 。 
因为 要 进行 词 频 统计 ， 所 以 先进 行 中 文 分 词 操作 。 在 这 里 使 用 的 是 jieba 分 词 ， 如 果 用 
户 没 有 安装 jieba 分 词 , 可 以 在 控制 台 使 用 pip install jieba 进行 安装 (可 以 使 用 pip list 查看 
是 否 安 装 了 这 些 库 )。 中 文 分 词 的 代码 如 下 : 

import jieba.analyse # 分 词 包 

# 使 用 jieba 分 词 进行 中 文 分 词 


result=jieba.analyse.textrank (cleaned comments,topK=50,withWeight=True) 











keywords=dict () 
For 1 in rosalt: 

keywords [i[0]]=i[1] 
print ("删除 停 用 词 前 ", keywords) 


结果 如 下 : 


{' 大 片 ': 0.28764823530539835，' 动 作 ' : 0.42333889433557714，' 人 质 ': 
0.18041389646505365，' 不 能 ': 0.18403284248005652，' 行 动 ' : 
0.5258110409848542,' 的 ': 0.19000741337241692，' 看 到 ' : 0.16410604936619055， 
' 太 ': 0.250308587701313， ' 导 演 ': 0.3247672024874971， ' 军 人 ' : 
0.22827987403008904， ' 主 旋律 ': 0.21300534948534544， ' 电 影 !: 1.0,，' 作 战 ' : 
0.17912699218043704， ' 震 撼 ': 0.24439586499277743， ' 国 产 ' : 
0.37209344994813087，' 人 物 ': 0.3211015399811397,，' 红 海 ' : 0.2759713023909607， 
' 有 点 ': 0.19442262680122022， ' 节 奏 ': 0.28504415161934643， ' 战 争 片 ' : 
0.305141973888238，,，' 战 争 ' : 0.38941165361568963,，' 爆 破 ' : 0.17280424905747072， 
"演员 ' : 0.18291268026465418，' 全 程 ': 0.1812416074586381， ' 湄 公 河 ' : 
0.4937422787186316，' 还 有 ' : 0.17809860837238478，' 个 人 ': 0.2610284731772877， 
" 黑 应 坠落 ' : 0.21305500057787405， ' 剧 情 ': 0.21982545428026873， ' 战 狼 ' : 
0.611947562855697，' 从 头 ': 0.21612064060347713，' 文 戏 ' : 0.38037163533740115， 
"军事 ': 0.39830147699101087， ' 好 看 ': 0.1843800611024451， ' 觉 得 ' : 
0.18438026420714343， "坦克 ' : 0.2103294696884718， ' 海 军 ': 0.2780877491487478， 
" 黄 景 ': 0.2762848729539791， ' 喜 欢 ': 0.186512622392206，' 好 莱 坞 ' : 
0.3041242625437134， "狙击 手 ': 0.4529383170599891,…} 


从 结果 可 以 看 到 进行 词 频 统 计 了 ， 但 数据 中 还 有 “ 太 ”“ 的 ”等 虚词 〈 停 用 词 )， 这 些 
词 在 任何 场景 中 都 是 高 频 词 ， 并 且 没 有 实际 的 含义 ， 所 以 要 把 它们 清除 。 

本 程序 把 停 用 词 放 在 一 个 名 为 stopwords txt 的 文件 中 , 将 数据 与 停 用 词 进行 比 对 即 可 。 
删除 停 用 词 的 代码 如 下 : 


keywords={x:keywords[x] for x in keywords if x not in stopwords} 
print ("删除 停 用 词 后 "，, keywords) 
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继续 使 用 print0 语 句 查 看 结果 ， 可 见 停 用 词 已 经 被 清除 了 。 




















了 10 页 


1 于 前 面 只 是 爬 取 了 第 1 页 的 评论 ， 所 以 数据 有 点 少 ， 在 最 后 给 出 的 完整 代码 中 怜 取 


的 评论 ， 所 得 数据 比较 有 参考 价值 。 


人 @ 用 词 云 进行 显示 


import matplotlib.pyplot as plt 


import matplotlib 


matplotlib.rcParams['figure.figsize']=(10.0, 5.0) 

from wordcloud import WordCloud # 词 云 包 

# 指 定 字体 类 型 、 字 体 大 小 和 字体 颜色 

wordcloud=WordCcloud (font path="simhei .ttf",background color="white", 


max 


font size=80,stopwords=stopwords) 


word frequence=keywords 


myword=wordcloud.fit words (word frequence) 


plt 
plt 
plt 


.imshow (myword) # 展 示 词 云图 
:axils("oFf™y 
.Show () 


其 中 ，simhei.ttf 用 来 指定 字体 ， 用户 可 以 在 百度 上 输入 simhei.ttf 进行 下 载 ， 然 后 放 入 程序 
的 根 目 录 中 。 
完整 的 程序 代码 如 下 : 


import warnings 





warnings.filterwarnings ("ignore") 

import jieba # 分 词 包 
import jieba.analyse 

import numpy #numpy 计算 包 
import re 


import matplotlib.pyplot as plt 


from urllib import request 


from bs4 import BeautifulSoup as bs 


import matplotlib 


matplotlib.rcParams['figure.figsize']=(10.0, 5.0) 


from wordcloud import WordCloud # 词 云 包 
# 分 析 网 页 函数 
def getNowPlayingMovie list(): 


| 394 


resp=request .urlopen ('https://movie.douban.com/nowplaying/ 
zhengzhou/') 

html data=resp.read() .decode ('utf-8') 

soup=bs (html data, 'html .parser') 

nowplaying movie=soup.find all('div', id="'nowplaying') 
nowplaying movie list=nowplaying movie[0] .find all('li', class = 
"list-item') 

nowplaying list=[] 

for item in nowplaying movie list: 
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nowplaying dict={} 
nowplaying dict['id']=item["'data-subject"] 
for tag img item in item.find all('img'): 
nowplaying dict['name']=tag img item["alt'"] 
nowplaying list.append (nowplaying dict) 
return nowplaying list 


# 胞 取 评论 函数 
def getCommentsById (movieId，pageNum) : # 参 数 为 电影 id 号 和 要 疏 取 评论 的 页 码 


eachCommentList=[]; 
if pageNum>0: 
start=(pageNum-1)*20 
else: 
return False 
requrl="'https://movie.douban.com/subject/' + movieId + '/comments' 
+'?2' +'start=' + str(start) + '&limit=20"' 
print (requrl) 
resp=request .urlopen (requrl) 
html data=resp.read() .decode ('utf-8') 
soup=bs (html data, 'html .parser') 
comment div lits=soup.find alll('div', class ='comment') 
for item in comment div lits: 
if item.find all('p') [0] .string is not None: 
eachCommentList.append (item.find all('p') [0] .string) 
return eachCommentList 


def main() : 


# 循 环 获取 第 2 个 电影 的 前 10 页 评论 
commentList=[] 
NowPlayingMovie list=getNowPlayingMovie list() 
for i in range(10): # 前 10 页 
num=i + 1 
commentList temp=getCommentsById (NowPlayingMovie list[1]['id'], 
num) # 指 定 哪 部 电影 。 因 为 索引 号 从 0 开始 ， 所 以 是 第 2 个 电影 。numb 是 疏 取 哪 一 页 评论 
commentList .append (CommentList temp) 
# 将 列表 中 的 数据 转换 为 字符 串 
comments="" 
for k in range (len (CommentList) ) : 
comments=comments+ (Str (CommentList[k])) .strip() 
# 使 用 正则 表达 式 去 掉 标 点 符号 
pattern=re.compile(r'[\u4e00-\u9fa5]+') 
filterdata=re.findall (pattern, comments) 
cleaned comments="''.join(filterdata) 
# 使 用 jieba 分 词 进 行 中 文 分 词 
result=jieba.analyse.textrank (cleaned comments,topK=50, 
withWeight=True) 
keywords=dict () 
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for i in result: 

keywords [i [0]]=i[1] 
print ("删除 停 用 词 前 ", keywords) #{ "演员 ' :0.18290354231824632, ' 大 片 ' : 

#0.2876433001472282} 

# 停 用 词 集合 
stopwords=set (STOPWORDS) 
f=open('./StopWords.txt',encoding="utf8") 
while True: 

word=f.readline() 

if word=="": 

break 

stopwords.add (word[:-1]) 
print (stopwords) 
keywords={x:keywords[x] for x in keywords if x not in stopwords} 
print (" 删 除 停 用 词 后 ", keywords) 
# 用 词 云 进行 显示 
wordcloud=WordCloud (font path="simhei.ttf",background color="white", 
max font size=80,stopwords=stopwords) 
word frequence=keywords 
myword=wordcloud.fit words (word frequence) 


plt.imshow (myword) # 展 示 词 云图 
plt.axis ("off") 
plt.show() 

# 主 函数 

main() 


程序 运行 后 显示 的 图 像 如 图 20-9 所 示 。 
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图 20-9 词 云 显示 结果 
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